Persistent identifiers 20150429_adlibgebruikersdag_v0_2
-
Upload
adlibgebruikersgroep -
Category
Presentations & Public Speaking
-
view
58 -
download
0
Transcript of Persistent identifiers 20150429_adlibgebruikersdag_v0_2
PERSISTENT URI’S IN ADLIB
Bert Lemmens | PACKED
27 april 2015 | Breukelen
● 2005: opgericht door Museum Dhondt-Dhaenens, S.M.A.K., M HKA & argos.
● 2011: erkend door de Vlaamse Gemeenschap als Expertisecentrum Digitaal Erfgoed.
● Vlaamse projecten: CEST, Scoremodel Digitale Duurzaamheid, TRACKS - Archiefzorg in de Kunstensector, VIAA - digitalisering A/V dragers, opencultuurdata.be, persistente identificatie
● Europese projecten: ATHENAplus, PREFORMA, europeana.space
● Scoremodel | Erfgoedstats | SODA | SIP creator
● packed.be | scart.be | projectcest.be | scoremodel.org
Voor wie ons nog niet kent: Dit is packed.
Project ‘Persistente Identificatie’● okt 2013 – sep 2014
● opdracht en financiering
Vlaamse Overheid, Departement Cultuur, Jeugd, Sport en Media
● partners:
Vlaamse Kunst Collectie (KMSK Antwerpen, MSK Gent, Groeningemuseum Brugge)
Contemporary Art Heritage Flanders (M HKA, Mu.Zee, SMAK, Middelheimmuseum)
● LUKAS
● Collectie Vlaamse Gemeenschap
Deze is een update van het
project persistente
identificatie.
5
● persistente URI’s● project update● URI’s documenteren● voorstel!
De agenda:
PERSISTENTE URI’S?
http://kmska.be/collectie/work/id/1856
kunstwerk
Persistente URI’s zijn webadressen voor kunstwerken.
m.n. de ‘real life’ kunstwerken op zaal
http://kmska.be/collectie/work/data/1856
metadata
Persistente URI’s zijn webadressen voor informatie
over kunstwerken.
De informatie die je bijvoorbeeld op je collectiewebsite
plaatst.
http://kmska.be/collectie/work/representation/1856
beeld
Persistente URI’s zijn webadressen voor beelden van
kunstwerken.
De foto’s van de kunstwerken uit je
collectie
PERSISTENTE URI =
● webadres● naam voor kunstwerk, metadata en beeld● opgesteld volgens standaard regels ● onveranderlijk● leesbaar ● geautoriseerd door het museum
Kortom: het kanaal waarlangs je
betrouwbare informatie over je collectie
verspreid op het web.
PERSISTENTE URI’S.WAAROM ZOU U?
#1 BETROUWBARE CONTENT NEGOTIATIE
http://www.middelheimmuseum.be/Museum_Middelheim_NL/MiddelheimNL/MiddelheimNL-Collectie/Aanwinsten/MiddelheimNL-Collectie-Aanwinsten-2012/Firmament-III.htmlURI’s zijn
persistent binnen de levensduur van je eigen website
17
http://www.middelheimmuseum.be/pics/Stad/Bedrijven/Cultuur_sport_recreatie/CS_Musea/Middelheim/Tentoonstellingen/x_jc_MIDD_Gormley121113_22.jpg
En ze zijn doorgaans niet bedoeld voor ‘human agents’.
Dat zorgt voor problemen als je URI’s gaat gebruiken voorbij de levensduur van je
website
Persistente URI?
En het maakt jouw beeld moeilijk vindbaar tussen
alle gelijkaardige beelden op het web
werkhttp://
kmska.be/collectie/
work/id/1856
datahttp://
kmska.be/collectie/
work/data/1856
beeldhttp://
kmska.be/collectie/
work/representation
/1856
Persistente URI’s maken jouw informatie en beelden uniek en
langdurig identificeerbaar op het
web.
werkhttp://cvg.be/
collectie/work/id/1856 data
http://kmska.be/collectie/
work/data/1856
beeldhttp://
kmska.be/collectie/
work/representati
on/1856
beeldhttp://
lukasweb.be/collectie/work/representation/
1856
datahttp://cvg.be/
collectie/work/data/
1856
datahttp://
vkconline.be/collectie/work/data/
1856
Het onderscheid met info en
beelden uit andere collecties is helder
#2 INFORMATIE CLUSTEREN OP HET
WEB
23
Dat wordt erg belangrijk als we
met z’n allen info en beelden op het web
gaan plaatsen
Het wordt pas echt interessant als je zo
nieuwe info en beelden op het
spoor komt.
CIDOC STATEMENT ON LINKED DATA IDENTIFIERS (2012)
● Museums are the sole authority with responsibility for establishing globally unique and persistent identities (URIs) for each of the objects in their collections;
● Each museum should establish and publish on the internet such a unique and persistent identity – preferably as http URI (= webadres) – for each of its objects;
● This URL should resolve to a human‐readable description of the object, which is sufficiently detailed to identify it unambiguously;
● Ideally, this URL should additionally resolve to a comparable description in a machine processible format, using best practice Linked Data principles;
● When describing the relationship of the collection object to its cultural context (people, places, events, etc.), the museum should where possible reuse URLs from common frameworks, rather than minting its own URLs for these concepts;
http://network.icom.museum/fileadmin/user_upload/minisites/cidoc/PDF/StatementOnLinkedDataIdentifiersForMuseumObjects.pdf
Daarom is het cruciaal dat je jezelf
als autoriteit kenbaar maakt over de info en beelden die jij verspreid.
werkhttp://cvg.be/
collectie/work/id/1856
datahttp://
kmska.be/collectie/
work/data/1856
beeldhttp://
kmska.be/collectie/
work/representati
on/1856
beeldhttp://
lukasweb.be/collectie/
work/representati
on/1856
datahttp://cvg.be/
collectie/work/data/
1856
makerhttp://
viaf.org/viaf/
312406452/
typehttp://
vocab.getty.edu/aat/
300033799
En het werkt ook omgekeerd: jij
maakt gebruik van de autoriteit van
anderen.
PERSISTENT?
Kort over hoe we in dit project
‘onveranderlijkheid’ nastreven.
Eenvoudige vorm
Voor meer details over de principes die we gebruiken: lees
het ISA rapport!
#1 EENVOUDIGE VORM
http://[domein]/ verplicht
[type object]/ optioneel
[type document]/ optioneel
[identificatienummer] verplicht
Een eenvoudige vorm maakt het
makkelijker om de onveranderlijkheid
van URI’s te bewaren.
#2 CONTROLE OVER DOMEINNAAM
museum domein collectiedata
VKC http://vlaamsekunstcollectie.be/collection/
Groeningemuseum http://groeningemuseum.be/collection/
KMSKA http://kmska.be/collection/
MSKGent http://mskgent.be/collection/
LUKAS http://lukasweb.be/collection/
S.M.A.K. http://smak.be/collection/
M HKA http://mukha.be/collection/
Middelheimmuseum http://middelheimmuseum.be/collection/
Mu.Zee http://muzee.be/collection/
CVG http://kunstenenerfgoed.be/cvg/collection/
Elke museum bepaalt een
(sub)domein dat voor onveranderlijke
data dient.
#3 GEBRUIK BESTAANDE ID’S
museum inventaris-nummer
Persistente URI - ID
Groeningemuseum
0.2.GRO0002.II .../collection/work/id/0_2_GRO0002_II
SMAK nvt nvt
MuHKA VH0178.1 .../collection/work/id/VH0178_1
Middelheim MID.B.109 .../collection/work/id/MID_B_109
Mu.Zee B000071(a) .../collection/work/id/B000071_a
MSKGent 1920-DB-1,2,3 .../collection/work/id/1920-DB-1_2_3
KMSKA 831/4 .../collection/work/id/831_4
CVG M423 A - N .../collection/work/id/M423_A-N
VKC nvt nvt
LUKAS nvt nvt
We hergebruiken inventarisnummers
omdat we daar al de ‘onverandelijkheid’
van nastreven.
#4 ZORG DAT HIJ GEBRUIKT WORDT >>> HTTP RESOLVING
naam = Persistente URI locatie = URL
werk http://middelheimmuseum.be/collection/work/id//MID.B.541
n/a
metadata http://middelheimmuseum.be/collection/work/data//MID.B.541
http://www.middelheimmuseum.be/Museum_Middelheim_NL/MiddelheimNL/MiddelheimNL-Collectie/Aanwinsten/MiddelheimNL-Collectie-Aanwinsten-2012/Firmament-III.html
beeld http://middelheimmuseum.be/collection/work/representation//MID.B.541
http://www.middelheimmuseum.be/pics/Stad/Bedrijven/Cultuur_sport_recreatie/CS_Musea/Middelheim/Tentoonstellingen/x_jc_MIDD_Gormley121113_22.jpg
We gebruikten het http protocol omdat we dan maximaal zeker zijn dat
medewerkers de URI’s ook gaan gebruiken.
PROJECT UPDATE
34
MILESTONES
● +34.000 kunstwerken met ID● >90% kunstenaars & objectnamen met ID● Demonstrator: clusters werken!● Resolver: gebruik je eigen webserver!● Datauitgever Handboek
De belangrijkste resultaten van 2014:
35
#1. +34.000 WERKEN MET ID
totaal aantal data pids 43.264
totaal aantal work pids 34.358
aantal work pids met 1 data pid 26.575 77 %
aantal work pids met 2 data pid’s 6.782 20 %
aantal work pids met 3 data pid’s 908 2,5 %
aantal work pids met 4 data pid’s 68 <1 %
aantal work pids met meer dan 4 data pid’s 25 <1 %
We weten hoeveel informatie we
hebben en hoeveel kunstwerken we
hebben
#2 TERMINOLOGIEEN: VERVAARDIGER
>> 90% van de 10.183 naamsvermeldingen geidentificieerd
>> Aantal unieke personen in de 10 collecties – geschat tussen 7.025 en 7.750
Aantal naams-vermeldingen
Aantal unieke strings in de naams- vermeldingen
Aantal records geïdentificeerd met maar 1 pURI
Aantal records geïdentificeerd met maar 2 pURI
Aantal records geïdentificeerd met maar 3 pURI
Aantal records geïdentificeerd met maar 4 pURI
10.183 7.750 1.373 (14%) 3.424 (34%) 4.083 (40%) 204 (2%)
Externe bron Aantal geïdentificeerde naamsvermeldingen
Aantal unieke kunstenaars
Aantal naamsvarianten gehaald uit de externe bron
RKDartists 8.708 7.025 21.413
VIAF 7.791 4.584 111.711
Wikidata 4.463 2.326 9.156
ODIS 347 165 -
Voor vrijwel alle kunstenaars konden
we bijkomende informatie uit
externe bronnen koppelen.
#2 TERMINOLOGIEEN: OBJECTNAAM
Aantal unieke waarden van objectnamen
Aantal unieke waarden geidentificieerd met een AAT-id
Aantal unieke AAT concepten
Engelse waarden
Franse waarden
Duitse waarden
Nederlandse waarden
697 663 344 1215 649 208 1166
• 958 records aangeleverd door musea
• 697 unieke waardes, waarvan 663 (95%) hebben een AAT-id gekregen
• eigenlijk gaat het over 344 unieke concepten
• nu doorzoekbaar op 3238 termen in meerdere talen
Het gebruik van objectnamen we
verrassend beperkt.
#3 DEMONSTRATOR: CLUSTERS!
Uit de tests met een eenvoudige
aggregator bleek dat persistente URI’s de vindbaarheid van info
een beelden sterk verbetert.
#3 DEMONSTRATOR: VERRIJKING!
En verrijking met dat uit VIAF,
RKDartists, Getty en Wikidata maakt kleine records veel
interessanter.
#4 HTTP RESOLVER TOOL
En we werken aan een tool om beheer
van persistente URI’s haalbaar te maken
voor museummedewerkers
.
#4 HTTP RESOLVER TOOL
Die tool is vrij beschikbaar.
#5 DATA UITGEVER + HANDBOEK
reso
lve
rmanagement
IT-verantwoordelijke
data uitgever
machine applicatie
We maken ook een handboek voor gebruik in het
museum.
#5 DATA UITGEVER + HANDBOEK
Te vinden op de CEST wiki.
44
TOEKOMST?
● Events > levensloop persistent identificeren
● Wikidata > LOD publicatie
● Data Cleansing met Open Refine > zelf semi-automatisch persistente URI’s linken voor personen, plaatsen en concepten> zoek Alina en Trinneke! en volg de workshop!
De volgende stappen voor 2015:
PERSISTENTE URI’S DOCUMENTEREN
46
VALKUILEN
● URI’s duurzaam documenteren?
● Extra werklast vermijden?
De twee grootste valkuilen voor ons project tot nog toe:
47
VALKUILEN
● URI’s duurzaam documenteren?● in collectiedata > in het collectiebeheersysteem● standaard beschrijvingsregels voor persistente URI’s
● Extra werklast vermijden?● invoer automatiseren● maar: flexibeliteit om vorm URI’s te bepalen
En hoe we die denken aan te
pakken.
PERSISTENTE URI’S IN HET WILD!
Daarvoor zijn we inspiratie gaan
opdoen bij anderen.
49
GEMEENTEMUSEUM
Het Gemeentemuseum documenteert
een persistent ID.
Het ID is niet het inventarisnummer.
Lijkt ook geen priref.
50
GEMEENTEMUSEUM
Maar gebruikt andere ID’s in zijn
URI’s
51
RIJKSMUSEUM
Ook het Rijksmuseum
documenteert een persistent ID.
ID is geen inventarisnummer,
lijkt een priref.
52
RIJKSMUSEUM
En verpakt die in een Handle URI
53
AMSTERDAM MUSEUM
Amsterdam Museum
documenteert de volledige Handlei
URI.
ID is geen inventarisnummer,
lijkt een priref.
MIDDELHEIMMUSEUM
Middelheim stopt URI’s voor personen
in de bestaande velden
Zowel domein en ID in aparte velden als
de volledige link.
55
COLLECTIE VLAAMSE GEMEENSCHAP
56
COLLECTIE VLAAMSE GEMEENSCHAP
CVG stopt domein en ID in nieuwe
velden.
VOORSTEL!
Kwestie van iedereen volgens
dezelfde praktijk te laten werken
58
STANDAARD IMPLEMENTATIE
● PACKED- Project Persistente Identificatie(Alina Saenko) &
● DEN – Netwerk Digitaal Erfgoed(Wilbert Helmus)
● 6 entities/12-17 velden● domain - id● plaats user interface
Samen met DEN om dat dit een structureel
probleem is in de erfgoedsector
59
VOORSTEL
Element Adlib database
Adlib
tag
Element name Visibility Place in user interface Example value repeatable
Automatic?
Adapl needed?
Work Collect.inf od object.pid.domain Yes with option to override value
Tab Object identification, under inventory number
http://kunstenenerfgoed.be/CVG/collection/work/id/
no yes
oi object.pid.ID Yes with option to override value
Tab Object identification, under inventory number
BK_2179 no yes yes
?? object.pid.URI Yes with option to override value
Tab Object identification, under inventory number
http://kunstenenerfgoed.be/CVG/collection/work/id/BK2179
no yes yes
Record Collect.inf cd collect.pid.domain Yes with option to override value
Tab Object identification, under inventory number
http://kmska.be/collection/work/data/
no yes yes
ci collect.pid.ID Yes with option to override value
Tab Object identification, under inventory number
BK_2179 no yes yes
?? collect.pid.URI Yes with option to override value
Tab Object identification, under inventory number
http://kmska.be/collection/work/data/BK_2179
no yes yes
Image Photo.inf pd photo.pid.domain Yes with option to override value
Tab Media identification, under ‘object identifier’
http://kmska.be/collection/work/representation/
no yes yes
pi photo.pid.ID Yes with option to override value
Tab Media identification, under ‘object identifier’
BK_2179 no yes yes
?? photo.pid.URI Yes with option to override value
Tab Media identification, under ‘object identifier’
http://kmska.be/collection/work/irepresentation/BK_2179
no yes yes
Date Collect.inf pt production.date.normalised.type
no ISO 8601 yes yes yes
pv production.date.normalised.value
no 1901/2000 yes yes yes
Artist or custodian
People.inf pd people.pid.domain yes Tab People identification, under ‘object identifier’
http://viaf.org/viaf/ yes Annotation tool
yes
pi people.pid.ID yes Tab People identification, under ‘object identifier’
71417899 yes Annotation tool
yes
?? people.pid.URI yes Tab People identification, under ‘object identifier’
http://viaf.org/viaf/71417899
yes yes yes
Objectname
Thesau.inf td thesau.pid.domain yes Tab Objectname identification, under ‘object identifier’
http://browser.aat-ned.nl/ yes Annotation tool
yes
ti thesau.pid.ID yes Tab Objectname identification, under ‘object identifier’
300078925 yes Annotation tool
yes
?? thesau.pid.URI yes Tab Objectname identification, under ‘object identifier’
http://browser.aatned.nl/300078925
yes yes yes
Tada!
60
DOCUMENTEN● Projectrapport:
http://www.projectcest.be/index.php/Project_Persistente_identificatie
● Data uitgever handboek:http://www.projectcest.be/index.php/Project_Persistente_Identificatie_II
● Voorstel:http://www.projectcest.be/images/f/fe/20150309_draft_pidimplementation_adlib_V1_2_EN.pdf
● Resolver softwarehttps://github.com/PACKED-vzw/resolver
● Open refinehttp://www.projectcest.be/index.php/Handleiding_Open_Refine
Alle links naar de relevante
documenten. Feedback is van harte welkom!
BEDANKT!