Digitalisierungsmetadaten Alex Jahnke Metadaten und Datenkonversion (SUB Göttingen) 14.04.2014.
-
Upload
ricarda-doscher -
Category
Documents
-
view
108 -
download
3
Transcript of Digitalisierungsmetadaten Alex Jahnke Metadaten und Datenkonversion (SUB Göttingen) 14.04.2014.
DigitalisierungsmetadatenAlex Jahnke
Metadaten und Datenkonversion (SUB Göttingen)
14.04.2014
Warum Digitalisierungsmetadaten?
• Der Digitalisierungsprozess erzeugt einzelne Dateien
• und dateibezogene Metadaten (EXIF, TIFF-Header)
Präsentation von Digitalisaten (Bücher)
Blättern
Zoomen
Anzeigen
Präsentation von Digitalisaten (Bücher)
Dokumentstruktur
DFG-Viewer (www.dfg-viewer.de)
Anforderungen an Digitalisierungsmetadaten
• Anzeigen
– Welche Bilddateien gehören zum digitalen Objekt?
– Welche dieser Bilddateien zeigen denselben Inhalt?
– Bei Büchern, Urkunden etc.: Welche Dateien enthalten den Volltext?
• Navigieren
– In welcher Reihenfolge sollen die Bilder angezeigt werden?
– Bei Büchern etc.: Welche Position in der Reihenfolge entspricht welcher Seite?
– Wie ist das Objekt strukturiert?
– Welche Bilddateien gehören zu welchen strukturellen Einheiten?
• Veröffentlichen
– Unter welchen Bedingungen kann das digitale Objekt genutzt werden?
– Worum handelt es sich bei dem Objekt überhaupt?
Die Dateien zusammenführen
Anforderungen an Digitalisierungsmetadaten
• Anzeigen
– Welche Bilddateien gehören zum digitalen Objekt?
– Welche dieser Bilddateien zeigen denselben Inhalt?
– Bei Büchern, Urkunden etc: Welche Dateien enthalten den Volltext?
• Navigieren
– In welcher Reihenfolge sollen die Bilder angezeigt werden?
– Bei Büchern etc: Welche Position in der Reihenfolge entspricht welcher Seite?
– Wie ist das Objekt strukturiert?
– Welche Bilddateien gehören zu welchen strukturellen Einheiten?
• Veröffentlichen
– Unter welchen Bedingungen kann das digitale Objekt genutzt werden?
– Worum handelt es sich bei dem Objekt überhaupt?
Die Dokumentstruktur abbilden
Anforderungen an Digitalisierungsmetadaten
• Anzeigen
– Welche Bilddateien gehören zum digitalen Objekt?
– Welche dieser Bilddateien zeigen denselben Inhalt?
– Bei Büchern, Urkunden etc: Welche Dateien enthalten den Volltext?
• Navigieren
– In welcher Reihenfolge sollen die Bilder angezeigt werden?
– Bei Büchern etc: Welche Position in der Reihenfolge entspricht welcher Seite?
– Wie ist das Objekt strukturiert?
– Welche Bilddateien gehören zu welchen strukturellen Einheiten?
• Veröffentlichen
– Unter welchen Bedingungen kann das digitale Objekt genutzt werden?
– Worum handelt es sich bei dem Objekt überhaupt?
Dateien und Dokumentstruktur verknüpfen
Anforderungen an Digitalisierungsmetadaten
• Anzeigen
– Welche Bilddateien gehören zum digitalen Objekt?
– Welche dieser Bilddateien zeigen denselben Inhalt?
– Bei Büchern, Urkunden etc: Welche Dateien enthalten den Volltext?
• Navigieren
– In welcher Reihenfolge sollen die Bilder angezeigt werden?
– Bei Büchern etc: Welche Position in der Reihenfolge entspricht welcher Seite?
– Wie ist das Objekt strukturiert?
– Welche Bilddateien gehören zu welchen strukturellen Einheiten?
• Veröffentlichen
– Unter welchen Bedingungen kann das digitale Objekt genutzt werden?
– Worum handelt es sich bei dem Objekt überhaupt?
Benutzungsbedingungen formulieren
Anforderungen an Digitalisierungsmetadaten
• Anzeigen
– Welche Bilddateien gehören zum digitalen Objekt?
– Welche dieser Bilddateien zeigen denselben Inhalt?
– Bei Büchern, Urkunden etc: Welche Dateien enthalten den Volltext?
• Navigieren
– In welcher Reihenfolge sollen die Bilder angezeigt werden?
– Bei Büchern etc: Welche Position in der Reihenfolge entspricht welcher Seite?
– Wie ist das Objekt strukturiert?
– Welche Bilddateien gehören zu welchen strukturellen Einheiten?
• Veröffentlichen
– Unter welchen Bedingungen kann das digitale Objekt genutzt werden?
– Worum handelt es sich bei dem Objekt überhaupt?
Das Objekt beschreiben (Buch)
Anforderungen an Digitalisierungsmetadaten
• Anzeigen
– Welche Bilddateien gehören zum digitalen Objekt?
– Welche dieser Bilddateien zeigen denselben Inhalt?
– Bei Büchern, Urkunden etc: Welche Dateien enthalten den Volltext?
• Navigieren
– In welcher Reihenfolge sollen die Bilder angezeigt werden?
– Bei Büchern etc: Welche Position in der Reihenfolge entspricht welcher Seite?
– Wie ist das Objekt strukturiert?
– Welche Bilddateien gehören zu welchen strukturellen Einheiten?
• Veröffentlichen
– Unter welchen Bedingungen kann das digitale Objekt genutzt werden?
– Worum handelt es sich bei dem Objekt überhaupt?
Metadata Encoding and Transmission Format (METS)
• XML Serialisierung
• 1. Fassung 2001 veröffentlicht
• verantw.: Library of Congress
• Aktuelle Version: 1.10
• http://www.loc.gov/standards/mets
http://www.loc.gov/standards/mets/METSPrimerRevised.pdf
METS
[Anlass der Präsentation]
Anwendungsprofile
• zvdd/DFG-Viewer METS-Profil (Version 2.0, 2008):– http://www.zvdd.de/fileadmin/AGSDD-Redaktion/
METS_Anwendungsprofil_2.0.pdf
• MODS-Anwendungsprofil für Digitalisierte Drucke (Version 2.1, 2012):– http://www.zvdd.de/fileadmin/AGSDD-Redaktion/
zvdd_MODS_Application_Profile_2.1.pdf
Bestandteile eines METS-Datensatzes
• Beschreibung des Datensatzes (Meta-Metadaten)
• Ersteller, Änderungsdatum etc.• es gibt genau 1 METS Header
• von METS vorgegebenes Format
• (bibliogr.) Beschreibung des Objektes und des Digitalisats
• kann beliebig oft wiederholt werden.
• kann beliebige Metadatenformate enthalten
• für Bücher oft: MODS oder MARC• für Handschriften oft: TEI• Kulturerbe Nds.: MODS• zvdd/DFG-Viewer: MODS
Bestandteile eines METS-Datensatzes
• Administrative Angaben– Rechte– technische Besonderheiten– Beschreibung der Analogen
Vorlage– Angaben zur Archivierung etc.
• kann beliebig oft wiederholt werden
• kann beliebige Metadatenformate enthalten
• zvdd/DFG-Viewer:– rightsMD: owner, logo, homepage– digiProv: reference, presentation
• Auflistung der zum digitalen Objekt gehörigen Dateien
• es gibt genau 1 fileSec Element• File Groups nach
Anwendungskontext (Auflösung, Dateiformat, Funktion (z.B. Thumbnails)
• zvdd/DFG-Viewer:– DEFAULT *– MIN *– MAX *– THUMBS– DOWNLOAD
Bestandteile eines METS-Datensatzes
• beschreibt die Objektstruktur• kann beliebig oft wiederholt
werden (oft gibt es 2 StructMaps)• bei Druckwerken:
– linear (Seitenfolge)– hiearchisch (Dokumentstruktur)
• von METS vorgegebenes Format• Verweise auf andere METS-
Dateien möglich• zvdd/DFG-Viewer:
– logische Structural Map– physische Structural Map
• beschreibt den Zusammenhang zwischen den verschiedenen Objektstrukturen (lineare und hierarchische)
• es gibt genau eine structLink Section
• von METS vorgegebenes Format• zvdd/DFG-Viewer:
– Verbindet logische und physische Structural Map
METS StructMap
zvdd/DFG-Viewer: Mehrbändige Werke (Anchor-Sätze)
Zeitschrift
Band
[Anlass der Präsentation]
Lies mich!
• METS : Metadata encoding and transmission standard ; primer and reference manual / Digital Library Federation. – Version 1.6 Revised. – Washington, DC, 2010. <http://www.loc.gov/standards/mets/METSPrimerRevised.pdf>
• METS : Metadata encoding and transmission standard ; official home page / Library of Congress.<http://www.loc.gov/standards/mets/>
MODS
• Metadata Object Description Schema• XML-Schema• hierarchisch• abgeleitet von MARC • setzt kein Regelwerk voraus• ursprünglich als bibliothekarisches Format entwickelt, mittlerweile auch in
anderen Bereichen nutzbar• Entwicklung koordiniert von der Library of Congress• einfacher als MARC, komplexer als Dublin Core Element Set• aktuelle Version 3.5, veröffentlicht am 9.7.2013• http://www.loc.gov/standards/mods/
http://kulturerbe.niedersachsen.de/viewer/piresolver?id=isil_DE-84_digibib_00041405
MARC21 - Feldformat
000 01353nam a2200301 c 4500001 313964912003 DE-601005 20130217033721.0008 000613s1889 gw 000 0 ger d035 $a(OCoLC)247369929035 $a(DE-599)GBV313964912040 $aGBVCP$bger$erakwb041 0 $ager100 1 $aTrojan, Johannes$0(DE-601)133778487$0(DE-588)117453889245 10$aKinderreime$cGesammelt und hrsg. von Johannes Trojan. Mit
36 Bildern von Wilh. Claudius und Eug. Klimsch260 3 $aStuttgart$bSchmidt & Spring$c[1889]300 $a160 S.$bzahlr. Ill.$c19,6 x 14,1 x 1,7650 7$0(DE-601)105451703$0(DE-588)4163853-0$aKinderreim$2gbv653 7$aKinderbuch$2gbv700 1 $aClaudius, Wilhelm$0(DE-601)078032695$0(DE-588)116539151700 1 $aKlimsch, Eugen$0(DE-601)247637459$0(DE-588)116228024
MODS – XML (1)<mods> <titleInfo> <title>Kinderreime</title> </titleInfo> <name type="personal" valueURI="http://d-nb.info/gnd/117453889"> <namePart type="family">Trojan</namePart> <namePart type="given">Johannes</namePart> <role> <roleTerm authority="marcrelator" type="code">ctb</roleTerm> </role> </name> <name type="personal" valueURI="http://d-nb.info/gnd/116539151"> <namePart type="family">Claudius</namePart> <namePart type="given">Wilhelm</namePart> <role> <roleTerm authority="marcrelator" type="code">ill</roleTerm> </role> </name> <name type="personal" valueURI="http://d-nb.info/gnd/116228024"> <namePart type="family">Klimsch</namePart> <namePart type="given">Eugen</namePart> <role> <roleTerm authority="marcrelator" type="code">ill</roleTerm> </role> </name> <typeOfResource>text</typeOfResource>
<originInfo> <place> <placeTerm type="code" authority="marccountry">gw</placeTerm> </place> <place> <placeTerm type="text">Stuttgart</placeTerm> </place> <publisher>Schmidt & Spring</publisher> <dateIssued>[1889]</dateIssued> <dateIssued encoding="marc">1889</dateIssued> <issuance>monographic</issuance> </originInfo> <language> <languageTerm authority="iso639-2b" type="code">ger</languageTerm> </language> <physicalDescription> <form authority="marcform">print</form> <extent>160 S. zahlr. Ill. 19,6 x 14,1 x 1,7</extent> </physicalDescription> …</mods>
MODS – XML (2)
MODS Elemente
• titleInfo• name• typeOfResource• genre• originInfo• language• physicalDescription• abstract• tableOfContents• targetAudience
• note• subject• classification• relatedItem• identifier• location• accessCondition• part• extension• recordInfo
MODS – „name“ (1)
<name> <displayForm>Gottfried Wilhelm Leibniz</displayForm></name>
MODS – „name“ (2)
<name type="personal"> <displayForm>Gottfried Wilhelm Leibniz<displayForm></name>
<name type="corporate"> <displayForm>Niedersächsisches Landesmuseum Hannover<displayForm></name>
MODS – „name“ (3)
<name type="personal"> <namePart type="family">Leibniz</namePart> <namePart type="given">Gottfried Wilhelm</namePart> <displayForm>Gottfried Wilhelm Leibniz<displayForm></name>
MODS – „name“ (4)
<name type="personal"> <namePart type="family">Leibniz</namePart> <namePart type="given">Gottfried Wilhelm</namePart> <namePart type="date">1749 - 1832</namePart> <displayForm>Gottfried Wilhelm Leibniz<displayForm> <role> <roleTerm type="text">Verfasser</roleTerm> </role> <role> <roleTerm type="text">Illustrator</roleTerm> </role></name>
MODS – „name“ (5)
<name type="personal" valueURI="http://d-nb.info/gnd/118571249"> <namePart type="family">Leibniz</namePart> <namePart type="given">Gottfried Wilhelm</namePart> <namePart type="date">1749 - 1832</namePart> <displayForm>Gottfried Wilhelm Leibniz<displayForm> <role> <roleTerm authority="marcrelator" type="code">aut</roleTerm> <roleTerm type="text">Verfasser</roleTerm> </role> <role> <roleTerm authority="marcrelator" type="code">ill</roleTerm> <roleTerm type="text">Illustrator</roleTerm> </role></name>
MODS – „name“ (6)
<subject> <name type="personal" valueURI="http://d-nb.info/gnd/118571249"> <namePart type="family">Leibniz</namePart> <namePart type="given">Gottfried Wilhelm</namePart> <namePart type="date">1749 - 1832</namePart> <displayForm>Gottfried Wilhelm Leibniz<displayForm> </name><subject>
MODS – „relatedItem“ (1)
MODS – „relatedItem“ (2)<relatedItem type="host"> <recordInfo> <recordIdentifier source="gbv-ppn">PPN603839967</recordIdentifier> </recordInfo> <titleInfo> <title>Lnye samling af det Kongelige Danske Videnskabernes Selskabs
skrifter </title> </titleInfo> <name type="personal"> <namePart type="family">Thiele</namePart> <namePart type="given">E.</namePart> </name> <originInfo> <dateIssued encoding="ISO 8601" keyDate="yes">1749 - 1832</dateIssued> </originInfo></relatedItem>
Danke für Ihre Aufmerksamkeit