Prepare your metadata - intro

29

description

Introductie voor de workshop 'Prepare your metadata' (Brussel, 17 juni 2014)

Transcript of Prepare your metadata - intro

Page 1: Prepare your metadata - intro
Page 2: Prepare your metadata - intro

OVER DOMEINEN & IDENTIFIERS

Henk Vanstappen

PACKED vzw PYM workshop 2014-06-18

Page 3: Prepare your metadata - intro

1. REALITY IS MESSY reality is messy

Carl Lagoze, 2001

Page 4: Prepare your metadata - intro

Pieter Brueghel de Oude Pieter Brueghel I Pieter Bruegel, 1525-ca 1569 Bruegel, Pieter, 1525?-1569 Bruegel, Pieter de Oudere Bruegel, Pieter, l'ancien Bruegel, Pieter, d.ä. Brueghel, Pieter, o Velho Брейгель, Питер, ок.

האב, פיטר, לBrueghel, Pieter the Elder, 1528-1569 Breughel, Pieter, the Elder

Page 5: Prepare your metadata - intro

PARIS

Page 6: Prepare your metadata - intro

KLEED

Page 7: Prepare your metadata - intro

KLEED

Page 8: Prepare your metadata - intro

Mona Lisa Monna Lisa La Joconde La Gioconda Portrait de Mona Lisa,

(1479-1528); dite La Joconde

Inv . nr. 799 Gian Giacomo Caprotti

Page 9: Prepare your metadata - intro

Mona Lisa Monna Lisa La Joconde La Gioconda Portrait de Mona Lisa,

(1479-1528); dite La Joconde

Inv . nr. 799 Gian Giacomo Caprotti LHOOQ

Page 10: Prepare your metadata - intro

Interbellum 1918-1940 11 november 1918 - 1 september 1939 November 11th, 1918 to September 1st, 1939 ca. 1920 – ca. 1935

Page 11: Prepare your metadata - intro

HET PROBLEEM

Resources niet uniek te identificeren Resources niet vindbaar Resources niet uitwisselbaar Extra metadata noodzakelijk

Page 12: Prepare your metadata - intro
Page 13: Prepare your metadata - intro

OPLOSSING#1: LIJSTJES lijsten afspraken maar: veel werk maar: probleme uitwisselbaarheid blijft

Page 14: Prepare your metadata - intro

OPLOSSING#2: AUTHORITIES

Page 15: Prepare your metadata - intro

OPLOSSING#3: ON LINE AUTHORITIES

Page 16: Prepare your metadata - intro

OPLOSSING#4: LINKED OPEN DATA Machineleesbaar Persistent Uniek: domein+identifier

Page 17: Prepare your metadata - intro

EXTERNE BRON (AUTHORITY)

•  binnen een bepaald domein •  unieke identificatie van resource •  eventueel verrijkt met bijkomende

gegevens •  te bevragen via http-protocol •  syntax:

namespace (domein) + identifier

Page 18: Prepare your metadata - intro

DOMEINEN & IDENTIFIERS

domein identifier Jansens Jan ISBN 978 0 5862 0747 5 HTML <a> EAD <name> AAT 300033618 Wordnet painting

Page 19: Prepare your metadata - intro

DOMEINEN & IDENTIFIERS

namespace identifier viaf.org 95761864 wikipedia.org Pieter_Bruegel_the_Elder dbpedia.org Pieter_Bruegel_the_Elder geonames.org 2800867

Page 20: Prepare your metadata - intro

PERSISTENTE URLS

base url identifier http://viaf.org/viaf/ 95761864/ http://wikipedia.org/ Pieter_Bruegel_the_Elder/ http://dbpedia.org/page/

Pieter_Bruegel_the_Elder/

http://geonames.org/ 2800867/

Page 21: Prepare your metadata - intro

KWALITEITSEISEN URI (SYNTAX)

•  Persistent en uniek •  Enkel letters, cijfers, underscore, hyphen •  Logische, eenvoudige opbouw •  Human readable •  Systeemonafhankelijk (geen query strings)

Page 22: Prepare your metadata - intro

KWALITEITSEISEN URI (SYNTAX) Wel: http://collectie.museum.org/data/12345 http://museum.org/collectie/data/12345 http://museum.org/collectie/12345/data Niet: http://europeana.eu/portal/record/15503/E627F23EF13FA8E6584AF8706A95DB85908413BE.html http://www.culture.gouv.fr/public/mistral/joconde_fr?ACTION=CHERCHER&FIELD_1=REF&VALUE_1=000PE025604

Page 23: Prepare your metadata - intro

KWALITEITSEISEN EXTERNE BRON

Inhoud •  scope •  volledigheid •  correct •  toegevoegde data (rijkdom) •  koppeling met andere authorities

Page 24: Prepare your metadata - intro

KWALITEITSEISEN EXTERNE BRON

Beheer •  persistente bron •  open licentie •  uitbreidbaar Toegang •  machineleesbaar (xml, json) •  GUI (html) •  API (OpenSearch, SRU, …)

Page 25: Prepare your metadata - intro

VOORBEELD: VIAF Links: http://viaf.org/ http://viaf.org/viaf/95761864/ http://viaf.org/viaf/95761864/rdf.xml http://viaf.org/viaf/95761864/viaf.xml http://viaf.org/viaf/95761864/marc21.xml http://viaf.org/viaf/95761864/justlinks.json Queries: http://viaf.org/viaf/search?query=cql.any+%3D+”Brueghel, Pieter”&httpAccept=application/rss%2bxml

Page 26: Prepare your metadata - intro

AGENDA Intro (Henk) Wat & hoe (Alina) •  Welke bronnen zijn geschikt? •  Persistente URI creëren Oefening: normaliseer en verrijk 10 objecten {pauze} Demo’s: •  Data cleanen met Open Refine (Alina) •  Systemen aanpassen: Adlib en CA (Jeroen & Joris) •  Proof of the pudding: verrijkte collectiecatalogus (Bert)

Page 27: Prepare your metadata - intro
Page 28: Prepare your metadata - intro

AGENDA Intro (Henk) Wat & hoe (Alina) •  Welke bronnen •  Persistente URI Oefening: normaliseer en verrijk 10 objecten {pauze} Demo’s: •  Data cleanen met Open Refine (Alina) •  Systemen aanpassen: Adlib en CA (Jeroen & Joris) •  Proof of the pudding: verrijkte collectiecatalogus (Bert)

Page 29: Prepare your metadata - intro

OEFENING 1. Download CSV file bit.do/pyd 2. Beschrijf werken in CSV file 3. Selecteer relevante domeinen en voeg waar

mogelijk PURLs toe voor namen, concepten, locaties en agents

4. creeer een PID voor de werken 5. creeer een PID voor de beschrijvingen (data)