Metadata (Vad är metadata?)

19
Sidnummer <metadata> Bibliografiskt stormöte Tema digitalisering KB, Hörsalen 17 dec 2013

description

A short lecture on metadata to an audience of staff at the National Library of Sweden. The theme of the meeting was digitization.

Transcript of Metadata (Vad är metadata?)

Page 1: Metadata (Vad är metadata?)

Sidnummer

<metadata>

Bibliografiskt stormöte Tema digitalisering

KB, Hörsalen 17 dec 2013

Page 2: Metadata (Vad är metadata?)

Sidnummer

Ska prata om…

• Vad är metadata, vilka metadatatyper pratar vi om, samt är det viktigt att dela in metadata i olika kategorier?

• Metadatastandarder – snabb genomgång av de för oss mest relevanta

• Något kort om digitalt bevarande

2013-12-17

[email protected] 2

Page 3: Metadata (Vad är metadata?)

Sidnummer

Metadata är…

• ”Data om data”

• Förenklar och effektiviserar uppföljning, tolkning, sökning och sortering av information

• Används av maskiner, måste därför kunna läsas av maskiner

2013-12-17

[email protected] 3

Presentatör
Presentationsanteckningar
Den semantiska betydelsen är ”data om data”, eller ”information om data”. Vi behöver metadata för att lättare och på ett mer effektivt sätt kunna tolka, söka och sortera en mängd information. Men i dagens digitala samhälle är det maskinerna som ska göra jobbet, det är de som använder och läser metadata…
Page 4: Metadata (Vad är metadata?)

Sidnummer

Strukturerad och väl definierad

• Strukturerad form (t.ex. xml) enligt ett väl definierat schema,

• med semantiska enheter (”data elements”) med definierade betydelser.

• Får extra stöd av ordlistor, auktoriserad data, etc.

• Internationella standarder att föredra

• (Regler – t.ex. RDA)

<titleInfo> <title>DAGENS NYHETER 1869-04-29</title> </titleInfo> <genre authority="marcgt">issue</genre> <language> <languageTerm authority="iso639-2b" type="code">swe</languageTerm> </language>

2013-12-17

[email protected] 4

Presentatör
Presentationsanteckningar
Det är därför viktigt att metadata har en strukturerad form, t.ex. i xml som i exemplet här, och att det är strukturerat enligt ett väl definierat schema (regelsystem) De semantiska enheterna, som också kallas ”data elements” (här i blått) eller ”attribut” (här i orange), deras betydelse måste vara väl definierade. De kan också få stöd av ordlistor och auktoriserad data (här i rött). Självklart är användning av internationella metadatastandarder att föredra, i vilket fall som helst ska hur man använder metadata vara väl dokumenterad.
Page 5: Metadata (Vad är metadata?)

Sidnummer

”Metadata universe”

Creative Commons Attribution-Noncommercial-Share Alike 3.0 United States License http://www.dlib.indiana.edu/~jenlrile/metadatamap/

Domain (Domän) - scholarly texts, moving images, geospatial data… Community – archives, libraries, museums… Function (Funktion) – record format, markup language, controlled vocabulary… Purpose (Ändamål) – descriptive, metadata wrappers, preservation, provenance…

2013-12-17

[email protected] 5

Presentatör
Presentationsanteckningar
Den här bilden har säkert många av er sätt förut. Den föreställer en slags atlas över “The metadata universe”, för att visa på den enorma mängd av olika metadatastandarder som finns. Man har delat in kartan i 4 olika delområden där varje del representerar en möjlig indelningsgrund för metadatatyper. Några exempel: Domän, Community, Funktion, Ändamål…
Page 6: Metadata (Vad är metadata?)

Sidnummer

Indela metadata i kategorier

• Deskriptiva/Beskrivande (descriptive) metadata - används för att hitta, identifiera och förstå en resurs

• Administrativa (administrative) metadata - används för att hantera skapandet, användningen och bevarandet av resursen (omfattar tekniska metadata och bevarandemetadata)

• Strukturella (structural) metadata - används för att registrera och underlätta relationerna mellan eller inom digitala resurser

• Användargenererade (use) metadata - metadata som samlas in från (eller handlar om) användarna själva (t.ex. användarnas anteckningar, antalet sökningar på en viss resurs)

Översättning från JISC Digital Media Guide http://www.jiscdigitalmedia.ac.uk/guide/an-introduction-to-metadata

2013-12-17

[email protected] 6

Page 7: Metadata (Vad är metadata?)

Sidnummer

Bibliografiska metadata

• Synonymt med deskriptiva metadata men med en mer specifik betydelse

• Kontext: bibliotek, förlag, vetenskaplig utgivning, etc.

• Bibliografisk information som förekommer i kataloger, bibliografier, bibliografiska referenser, etc.

2013-12-17

[email protected] 7

Page 8: Metadata (Vad är metadata?)

Sidnummer

”Metadata som metadata… eller?”

• Fyller dessa indelningar i olika kategorier av metadata egentligen någon funktion?

• Praktiskt vid planering av nya verksamheter (vilka särskilda metadatakategorier måste man inkludera som stöd för dessa verksamheter?)

• Vanlig distinktion är den mellan deskriptiva och administrativa metadata – metadata som riktar sig till slutanvändarna (offentligt) – metadata som i första hand är för internt bruk och för förvaltning av

samlingarna (dolt).

• Gränserna inte knivskarpa.

• Viktigare se metadata som ”informationsbitar” som kan användas av olika system och för olika syften

2013-12-17

[email protected] 8

Presentatör
Presentationsanteckningar
Kan vara praktiskt i vissa sammanhang. Till exempel då man utvecklar nya ramverk kring digitala samlingar. Vilka aktiviteter behöver man stödja? Vilka särskilda metadatakategorier måste man inkludera att stödja dessa verksamheter? Den breda distinktionen mellan "beskrivande metadata" och "administrativ metadata" blir en påminnelse om att en del metadata riktar sig särskilt till slutanvändarna och andra metadata kommer i första hand att vara för internt bruk och för förvaltning av samlingarna. Beskrivande metadata kommer med all sannolikhet att sökas och visas i ett offentligt gränssnitt, medan en stor del av de administrativa metadata måste döljas från offentlig visning.
Page 9: Metadata (Vad är metadata?)

Sidnummer

Exempel: Filformat

– <dc:format>text/html</dc:format>

– <premis:formatName>Hypertext Markup

Language</premis:formatName>

– <premis:formatVersion>4.01</premis:formatVersion>

– <premis:formatKey>fmt/100</premis:formatKey>

– <premis:formatRegister>pronom</premis:formatRegister>

• Metadata om filformat anses nog i första hand som teknisk

• Är också en viktig del av bevarandemetadata.

• Kan ofta vara viktig för beskrivning (förståelse) av resursen

• I grunden samma information men kan med automatik visas på olika sätt i olika sammanhang och i olika system

2013-12-17

[email protected] 9

Page 10: Metadata (Vad är metadata?)

Sidnummer

METADATASTANDARDER Ett urval

2013-12-17

[email protected] 10

Page 11: Metadata (Vad är metadata?)

Sidnummer

Metadatastandarder

Deskriptiva (Bibliografiska)

• Exempel DC

DC/dcterms – Dublin Core Beskrivning av digitala objekt (i så bred mening som möjligt). http://dublincore.org

MODS – Metadata Object Description. Rikt språk – mappning till MARC http://www.loc.gov/standards/mods/

MARCXML – MARC 21 in XML http://www.loc.gov/standards/marcxml

2013-12-17

[email protected] 11

Page 12: Metadata (Vad är metadata?)

Sidnummer

Metadatastandarder

Arkiv

• Ur ett exempel i EAD (Ediffah)

EAD - Encoded Archival Description. Arkivbeskrivningar. http://www.loc.gov/ead/

EAC-CPF - Encoded Archival Context – Corporate bodies, Persons, and Families. Om arkivbildaren. http://eac.staatsbibliothek-berlin.de/

2013-12-17

[email protected] 12

Page 13: Metadata (Vad är metadata?)

Sidnummer

Metadatastandarder

Bild och konstföremål

CDWA – Categories for the Description of Works of Art. http://www.getty.edu/research/publications/electronic_public

ations/cdwa

VRA CORE – a data standard for the description of images and works of art and culture http://www.loc.gov/standards/vracore/

Baselitz Skulptur „Armalamor” in der Deutschen Bibliothek in Frankfurt (Foto: stideg)

2013-12-17

[email protected] 13

Page 14: Metadata (Vad är metadata?)

Sidnummer

Metadatastandarder

”Tekniska”

• om de digitala objekten, exempel MIX

TextMD – Technical Metadata for Text http://www.loc.gov/standards/textMD/

MIX – Metadata for Images in XML http://www.loc.gov/standards/mix/

AES-X098B och AES-X098C. För audio/video (kommer) Audio Engineering Society http://www.aes.org/

audioMD och videoMD http://www.loc.gov/standards/amdvmd/

Grundläggande teknisk info även i:

METS och PREMIS

2013-12-17

[email protected] 14

Presentatör
Presentationsanteckningar
Med tekniska metadata menas ofta metadata som skapas av systemen i samband med skapande av datafilerna. T.ex. kameror, skannrar och programvara för ocr-läsning som används i digitaliseringen. Ofta lagras samma metadata även i filen.
Page 15: Metadata (Vad är metadata?)

Sidnummer

Metadatastandarder

Digitalt bevarande

• Exempel premis:event

PREMIS – Preservation Metadata: Implementation Strategies. Information för att underlätta digitalt bevarande. http://www.loc.gov/standards/premis/

2013-12-17

[email protected] 15

Presentatör
Presentationsanteckningar
Det finns bara en standard för bevarandemetadata. Här samlas omfattande information om vad som krävs för att underlätta digitalt bevarande. Baserad på erfarenheter från olika institutioner världen över. Har en datamodell som vi använt oss av som grund i data- och metadatamodellen för Mimer. I fokus: Tekniska data om varje objekt, men mer utförligt om filformat. Händelser och agenter (vilka åtgärder har man vidtagit och vilka program har varit inblandade) – som ett led i att kunna spåra bakåt vad som hänt med filerna i arkivet.
Page 16: Metadata (Vad är metadata?)

Sidnummer

Metadatastandarder

Analys, uppmärkning

• Beskriver layout och innehåll, skapar nytt innehåll. Exempel ALTO (3 rader ur digitaliserad tidningssida)

ALTO – Analyzed Layout and Text Object Exempel dagstidningar http://www.loc.gov/standards/alto/

TEI – Text Encoding Initiative Exempel handskrifter http://www.tei-c.org/

Daisy - Digitalt Anpassat InformationsSYstem (Digital Accessible Information SYstem) Uppmärkt text synkroniserad med ljudfiler www.daisy.org/

2013-12-17

[email protected] 16

Page 17: Metadata (Vad är metadata?)

Sidnummer

Metadatastandarder

Paketera information

METS - Metadata Encoding and Transmission Standard. Används för paketering av alla typer metadata och digitala objekt. http://www.loc.gov/standards/mets/

Didl - Digital Item Declaration Language. Används framför allt till paketering av filer av typen MPEG-2. http://xml.coverpages.org/mpeg21-didl.html

XFDU - XML Formatted Data Unit. Liknar METS. Från NASA. http://sindbad.gsfc.nasa.gov/xfdu/index.html

2013-12-17

[email protected] 17

Page 18: Metadata (Vad är metadata?)

Sidnummer

Metadatastandarder

”Att synas på webben”

• Webbsida från BNF. HTML-koden innehåller metadata från schema.org

RSS – Really Simple Syndication Abonnemang på nyhetsflöden. Innehåller ofta DC http://www.rssboard.org/rss-specification

schema.org - samarbete mellan Bing, Google, Yahoo! och Yandex ”to create and support a common set of schemas for structured data markup on web pages”, “to improve the display of search results” http://schema.org

http://data.bnf.fr/11907966/victor_hugo/

2013-12-17

[email protected] 18

Presentatör
Presentationsanteckningar
Hitta olika sätt för oss att göra våra digitaliseringar synliga. Wikipedia, sociala medier som Facebook, Twitter, etc. Metadatastandarder som man kan använda är förstås RSS genom att informera via nyhetsflöden. Franska NB lägger in metadata från schema.org på de sidor som de vill ska få bättre rankning hos de stora sökmotorerna. Schema.org – samarbete för att skapa och stödja en gemensam uppsättning scheman för strukturerad uppmärkning av webbsidor.
Page 19: Metadata (Vad är metadata?)

Sidnummer

Digitalt bevarande

• Metadata är en viktig del av det digitala bevarandet.

• Planering av metadata behöver komma in tidigt i digitaliserings-processen.

Säkra åtkomsten till KBs digitala samlingar nu, och i framtiden. Bevara för att tillgängliggöra!

Syftar till: Att säkra det digitala materialets fortlevnad, samt att kunna verifiera materialets autenticitet.

Omvärldsbevakning

Åtkomst

Säkerhet

Filformat

Migrering - Emulering

Metadata

Lagringsprognoser

2013-12-17

[email protected] 19

Presentatör
Presentationsanteckningar
Det finns, i huvudsak, två övergripande mål för digitalt bevarande.�Det första är att säkra åtkomsten till Kungliga bibliotekets digitala samlingar nu, och i framtiden. Bevarandet av samlingarna syftar till att säkra det digitala materialets fortlevnad.�Det andra är att kunna verifiera materialets autenticitet. Med autenticitet menar vi här att materialet har hanterats på ett sådant sätt så att man, med hjälp av teknik och dokumentation, kan visa att det material som finns i samlingarna är det som en gång samlades in. http://intranat.kb.se/Styrdokument/policies/2-BEVARA-Digitalt-bevarande/