Open standaarden, DE BASIS Open standaarden, DE BASIS en de Digitale Collectie en de Digitale Collectie
NederlandNederlandJeroen van der VlietJeroen van der Vliet
Wat is de Digitale Collectie Nederland?
Omvang (fysiek) cultureel erfgoed
musea: ca. 44 miljoen objecten (MUSIP/Collectiebalans 2008)
archieven: ca. 600 km of 3,6 miljard pagina's (Alles uit de kast
1998)
wetenschapsbibliotheken: ca. 9 miljoen items (Alles uit de
kast 1998)
monumentenzorg: 42.792 gemeentelijke en 61.037
rijksmonumenten en archeologie: 12.996 archeologische
terreinen (Erfgoedbalans 2009) beeld en geluid: 1.500.000 uur
(NORAA, Schatgraven in de regio 2006)
Alles digitaal kost naar schatting minimaal 150.000
levensjaren!
Doel van digitalisering
Waarvoor?
Toegankelijkheid voor het publiek26%Conservering 23%Wetenschappelijk onderzoek 18%Educatie 16%Communicatie 14%Anders 3%
Bron: DEN, De Digitale Feiten 2008
Wat doet DEN?
A - Beleid
B - Plannen
C - Uitvoering
D - Evaluatie
Voorbereiding
Vervaardiging
Beschrijving
Opslag
Toegang
Presentatie
Beheer & gebruik
Interoperabiliteit
Duurzaamheid
Praktijk van het digitaliseren
• handreiking voor succesvolle inzet van ICT door een
erfgoedinstelling, bijvoorbeeld bij digitalisering van de
collectie of het opzetten van digitale dienstverlening
• biedt een gestructureerd overzicht van nationale en
internationale ICT-standaarden (180+) en andere
kwaliteitsinstrumenten, inclusief verwijzingen naar
documentatie, sjablonen en voorbeeldprojecten
• te vinden op www.den.nl/register
Het ICT-register voor het cultureel erfgoed (Kennisbank)
• een set van minimale eisen voor digitalisering van erfgoed
• beschrijft basic practice en gaat uit van het ICT-register van
DEN
• gebaseerd op de kennis en praktijk van erfgoedprofessionals
• uitgangspunt is zelfregulering en evaluatie door het
erfgoedveld
• open standaarden (helaas lukt dit nog niet altijd)
• maakt onderdeel uit van het ICT-register (apart gemarkeerd)
• belangrijk leidraad bij subsidie-aanvragen én beoordelingen
• te vinden op www.den.nl/debasis
DE BASIS: Bouwen Aan Succesvolle ICT-Strategie
Wat is inmiddels opgenomen?
2K, AIFF, D10, Dublin Core, ECIRGB, GML, HTTP, JPEG, JPEG2000,
Kodak Greyscale 013, MacBeth Colorchecker, (KML), MPEG-2,
MPEG-4, MP3, NAP, OAI-PMH, OAIS, QuickTime, RD, SRU/SRW,
TIFF, (TEI), TRAC, UTF-8, URI, WAV, XML voor Vindbaarheid,
Vervaardiging en Duurzaamheid van het digitaal erfgoed
Wat staat er nog in de wacht?
Presentatie: toegankelijkheid; online presentaties; Web 2.0
Beschrijving: gebruik metadata en terminologiebronnen zoals
vocabulaires, thesauri en ontologieën; semantisch web-
toepassingen
DE BASIS: Bouwen Aan Succesvolle ICT-Strategie
Casus: is digitaal erfgoed ook vindbaar op het Web?
op zoek naar informatie over
Tamme Beth IJsbrandsz.
of Tamme Beth Ysbrandsz
Ta?me Bet? ?sbrands*
Tamme Beth
wat weten we?
was actief als scheepsmakelaar, cargadoor en boekhouder
leefde en werkte in Amsterdam in tweede helft 18de eeuw
Gezocht op "tamme beth" en 50 treffers retour.
Maar is alles ook bruikbaar? Een selectie ...
www.google.nl/search?q="tamme+beth"
Tsja, wel de juiste naam, maar niet
van de persoon die we zoeken ...
www.facebook.com
Google scant oude boeken en maakt die
Google Books
op trefwoorden doorzoekbaar ...
books.google.nl
... dankzij tekstherkenning of OCR, hier als "plat" tekstbestand;
The Internet Archive
effectief maar de tekst staat nog wel vol met "lees"-fouten.
www.archive.org
Ook een database is goed indexeerbaar voor
De VOC-site (particulier initiatief)
zoekmachines, tenminste als ...
www.vocsite.nl
... elke bron of pagina een
Maritieme Kalender (Scheepvaart Museum Amsterdam)
eigen URL heeft.
www.scheepvaartmuseum.nl/collectie/maritieme-kalender
Een "platte" tekst zoals HTML: daar kunnen alle
Texelse genealogie (particulier initiatief)
zoekmachines probleemloos mee uit de voeten.
home.hccnet.nl/mwk/
is dit alles?
Niet gevonden omdat de bronnen geen eigen URL hebben,
Maritiem Digitaal
die is er wel, maar zit verstopt in de pagina zelf ...
www.maritiemdigitaal.nl
Zou er nou echt niet iets te vinden zijn?
Archiefbank (Stadsarchief Amsterdam)
www.stadsarchief.amsterdam.nl/archieven/archiefbank/
A-ha! Wel een URI via het afbeeldingsnummer,
Archiefbank (Stadsarchief Amsterdam)
maar de plaatjes hebben geen metadata ...
www.stadsarchief.amsterdam.nl/archieven/archiefbank/
Metadata helpt afbeeldingen doorzoekbaar
Archiefbank (Stadsarchief Amsterdam)
te maken, handig als spelling soms anders is ...
www.stadsarchief.amsterdam.nl/archieven/archiefbank/
Beschrijf gescande teksten en afbeeldingen en koppel
Dataset Archief van de Waterschout
de data aan het object via een unieke identifier, bijv. img.
staat nog op de computer van de auteur
Toevalstreffer? Dankzij de juiste karakterset (UTF-8) is
Google Images / Museovirasto (Finland)
deze Finse pagina goed indexeerbaar en ook leesbaar
images.google.nl / www.nba.fi
• zet uw digitale collectie op internet (HTTP)
• elk object en beschrijving is via een eigen webadres (URI) te
vinden
• maak beschrijving (metadata: Dublin Core) + structuur (XML,
sitemap)
• teksten zijn goed leesbaar (niet-westerse, speciale leestekens:
UTF-8)
• scheid vormgeving van inhoud (X/HTML, CSS)
• maak koppelingen met andere websites, biedt mogelijkheid
andere databases te doorzoeken en maak dat ook mogelijk
voor uw eigen website, werk samen met portals (OAI-PMH, SRU)
• stel altijd de gebruiker centraal (usability test)
• maak uw website voor iedereen toegankelijk
(webrichtlijnen overheid, WCAG, Drempels Vrij)
Hoe maak ik mijn collectie beter vindbaar?
Top Related