Victor dcl11-haarlem

17
Amsterdam Museum als Europeana Linked Open Data Victor de Boer -- VU Amsterdam Met Antoine Isaac, Jan Wielemaker, Jacco van Ossenbruggen Michiel Hildebrand en Guus Schreiber

description

[Dutch] Presentatie over de conversie van Amsterdam Museum metadata naar Linked Open Data in het Europeana Data Model.

Transcript of Victor dcl11-haarlem

Page 1: Victor dcl11-haarlem

Amsterdam Museum als Europeana Linked Open Data

Victor de Boer -- VU Amsterdam

Met Antoine Isaac, Jan Wielemaker, Jacco van Ossenbruggen Michiel Hildebrand en Guus Schreiber

Page 2: Victor dcl11-haarlem

www.europeanaconnect.eu

Europeana

• “Europeana enables people to explore the digital resources of Europe's museums, libraries, archives and audio-visual collections.’’

• Huidige versie verzamelt alle metadata van instellingen in dublin core velden (Europeana Semantic Elements).

• Goed voor textueel zoeken, maar:• Geen relaties tussen objecten, concepten, plaatsen, namen.

• Term/taal-afhankelijk

• Rijke originele metadata wordt ‘platgeslagen’

www.europeana.eu

Page 3: Victor dcl11-haarlem

www.europeanaconnect.eu

Europeana Data Model

• Doelen van EDM• Behoud van originele metadata• Gebaseerd op semantic web principes (resources, URI’s, RDF, links)

• Gebouwd op bekende standaarden• OAI ORE (proxy, aggregation, physicalObject)• Dublin Core voor metadata representatie (plus Europeana-

specifieke properties)• SKOS voor vocabulaires

Page 4: Victor dcl11-haarlem

www.europeanaconnect.eu

EDM voorbeeld

proxy

objectmetadata

Aggregation

Provenance +web

views/plaatjes

Physical Objectgeen

metadata

Page 5: Victor dcl11-haarlem

www.europeanaconnect.eu

Cliopatria

Conversie stappen

• Tools ontwikkeld om van originele cultural erfgoed metadata naar EDM data te komen (+ Linked) (+ Open data)

• Stappenplan

1. Start met XML (of OAI-harvest)

2. Syntactische transformatie naar RDF

3. Herschrijf de ruwe RDF

4. Definieer een schema dat classes/properties

naar EDM classes/properties mapt

5. Link naar Europeana en externe bronnen

6. Publiceren als LOD

XMLRDF

Amalgame

Page 6: Victor dcl11-haarlem

www.europeanaconnect.eu

Page 7: Victor dcl11-haarlem

www.europeanaconnect.eu

Amsterdam Museum data

• Adlib database XML API

• Object metadata

• 73.000 objecten

• Concept Thesaurus

• 27.000 concepten

• geo,motieven, tentoonstellingen,…

• Personenlijst

• 67.000 personen

• Creators, annotators, reproduction creators, institutions,…

<record priref="10541“ > <acquisition.date>1997</acquisition.date> <dimension> <dimension.type>hoogte</dimension.type> <dimension.unit>cm</dimension.unit> <dimension.value>6</dimension.value> </dimension> …</record>

<record priref="28024“ > <term>Kalverstraat 124</term> <broader_term>Kalverstraat</broader_term> <term.type>GEOKEYW </term.type> </record>

<record priref="6" > <biography>boekverkoper en uitgever van cartografie</biography> <birth.date.start>1659</birth.date.start> <death.date.start>1733</death.date.start> <name>Aa, Pieter van der</name> <nationality>Nederlands</nationality> <use>Aa, Pieter van der (I)</use> </record>

Page 8: Victor dcl11-haarlem

www.europeanaconnect.eu

Conversie naar RDF

• Eerste directe conversie naar ruwe RDF

• Dan herstructurering met herschrijfregels (XMLRDF)• Met de hand gemaakt

• RDF ‘interpretatie’ van de originele metadata. • Termen worden resources: URIs

• PURL basename: purl.org/collections/nl/am/• Gebruik prirefs, voorafgegaan door “proxy-”, “aggregation-”, “p-” of “t-”

• Opschonen (remove empty vals)

• Sommige complexe xml structuren blijven ‘blank nodes’

• Maak EDM-RDF• RDF schema relateert alle AM properties naar EDMproperties.

Page 9: Victor dcl11-haarlem

www.europeanaconnect.eu

RDF subproperties

am:proxy_22093

1770

1790

am:productiondateStart

am:productiondateEnd

dcterms:created

rdfs:subPropertyOf

Page 10: Victor dcl11-haarlem

www.europeanaconnect.eu

Linken via thesaurus alignment.

• 143 links naar GeoNames NL

• 2498 AM concepten naar AATNed.

• 1322 links to be checked

http://semanticweb.cs.vu.nl/amalgame/

Page 11: Victor dcl11-haarlem

www.europeanaconnect.eu

Personen

• 1076 AM personsen gelinkt aan ULAN (VIAF)

• 34 aan DBPedia

• Meer ter controle

Page 12: Victor dcl11-haarlem

www.europeanaconnect.eu

Aanbieden van de data

• PURL redirect nu naar de VU semantic layer• http://purl.org/collections/nl/am/proxy-63432 • http://semanticweb.cs.vu.nl/europeana/browse/list_resource?r=htt

p://purl.org/collections/nl/am/proxy-63432

• HTTP request HTML: • Local condensed view• Local full view

• HTTP request RDF/XML• rdf/xml “describe”

• SPARQL endpoint

Page 13: Victor dcl11-haarlem

www.europeanaconnect.eu

Page 14: Victor dcl11-haarlem

www.europeanaconnect.eu

Page 15: Victor dcl11-haarlem

www.europeanaconnect.eu

http://semanticweb.cs.vu.nl/europeana/user/query

Page 16: Victor dcl11-haarlem

www.europeanaconnect.eu

En nu?

• “Sharable, spreadable and nerd-friendly”

• CKAN, thoughtlab,…

• More links• Amsterdam Rijksmonumenten,Stadsarchief..• DBPedia (SILK): LATC

• Apps

• Nu nog een éénmalige conversie, moet onderdeel worden van het normale collectiebeheer

(@charlotteshj kulturwebb)

Page 17: Victor dcl11-haarlem

www.europeanaconnect.eu

URL pointers

• Amsterdam Museum in EDM LOD• http://semanticweb.cs.vu.nl/lod/am/• http://ckan.net/package/amsterdam-museum-as-edm-lod• Thoughtlab

• Semantic layer• [Browse] http://semanticweb.cs.vu.nl/europeana/• [SPARQL] http://semanticweb.cs.vu.nl/europeana/user/query

• Tools• [ClioPatria]

http://e-culture.multimedian.nl/software/ClioPatria.shtml• [xmlrdf] http://semanticweb.cs.vu.nl/Connect/xmlrdf.pdf• [Amalgame] http://semanticweb.cs.vu.nl/amalgame/