Duurzaam digitaliseren: praktijk
-
Upload
heemkunde-vlaanderen -
Category
Government & Nonprofit
-
view
114 -
download
1
Transcript of Duurzaam digitaliseren: praktijk
DUURZAAM
DIGITALISEREN:
PRINCIPES &
STRATEGIEEN
Rony Vissers & Bert Lemmens | PACKED vzw
6 mei 2015 | Heemkunde Vlaanderen
HUISWERK - KNELPUNTEN
● Bewaarstrategie:
Ik weet niet waar ik moet
beginnen om mijn bestanden
langdurig toegankelijk te maken.
● Kwaliteitscontrole:
Ik weet niet hoe ik moet
controleren of een bestand
duurzaam is of niet.
● Opslagbeheer:
Mijn bestanden zijn niet veilig
opgeslagen.
● Opnameprocedure:
Ik krijg geen overzicht over de
massa bestanden in mijn
collectie.
● Toegang:
Ik weet niet hoe ik al die
bestanden toegankelijk moet
maken via het web
HUISWERK - OPDRACHT
● Wat beschouw je op basis van je eigen ervaring als de grootste
bedreiging m.b.t. duurzame digitale toegankelijkheid in je eigen
organisatie?
Maak een rangorde op van 1 tot 5.
● Beschrijf voor de twee grootste bedreigingen een concrete situatie die
problematisch is voor je organisatie en die je aan PACKED vzw en je
medecursisten wil voorleggen tijdens de volgende bijeenkomst.
Formuleer in je eigen woorden ook zelf een mogelijke oplossing.
HUISWERK - OPDRACHT
• 2. Onbetrouwbare en
vergankelijke dragers
• 1. Verouderde technologie
• 3. Onduidelijke en uitdijende
omvang
• 4. Rechten en patenten
• 5. Gebrek aan toegang
22 (3x nr. 1)
23 (4x nr. 1)
25 (2x nr. 1)
34 (0x nr. 1)
40 (1x nr. 1)
5 THEMA’S / 15 VRAGEN
• Digitalisering
• Verouderde technologie
• Onbetrouwbare & vergankelijke dragers
• Onduidelijke en uitdijende omvang
• Toegang
I. DIGITALISERING
1. Digitalisering audiovisuele collecties / archieven
Is DVD een goed formaat om video’s of filmpjes naar te
digitaliseren?
2. Fotografie / scanning
Is JPEG een goed formaat om foto’s te maken/scannen? Wat
is het onderscheid tussen JPEG en TIFF? Is PDF een
alternatief?
1. AUDIOVISUELE COLLECTIES?
• doelstelling: digitale archivering, ontsluiting, …?
• onderscheid tussen dragerformaat en bestandsformaat
• onderscheid tussen bewaring dragers, formaten en inhoud
• open formaten / propriëtaire formaten
• geen compressie / lossless compressie / lossy compressie
• ondersteuning door meerdere fabrikanten
• eenvoud, documentatie
• onderscheid tussen scannen naar beeldensequentie en
omzetten naar videosignaal
2. FOTOGRAFIE & SCANNING?
• doelstelling: digitale archivering, ontsluiting, …?
• open formaten / propriëtaire formaten
• geen compressie / lossless compressie / lossy compressie
• ondersteuning door meerdere fabrikanten
• eenvoud, documentatie
• relatie RAW - DNG / TIFF / JPEG
• waar op letten bij TIFF: TIFF v6.0 uncompressed baseline
RGB
• voor- en nadelen van PDF als alternatief: PDF/A,
bewerkingsmogelijkheden
II. VEROUDERDE TECHNOLOGIE
3. Wat zijn duurzame bestandsformaten?
4. Wat te doen met audiovisuele collecties / archieven op
magnetische dragers?
5. Wat te doen als foto’s al zijn opgeslagen in JPEG? Alsnog
omzetten naar TIFF?
6. Zijn Access en Excell goede, duurzame oplossingen? Wat
kan er verloren gaan bij evolutie in de software? Hoe kun je
Excell overzetten naar Access? Wat zijn de voor- en nadelen
van registratie in Acces en Excell? Hoe kun je de veroudering
van deze softwarepakketten opvolgen? Wat zijn
alternatieven?
7. Verantwoord uniform softwarepakket <> brede waaier aan
software? Onderscheid tussen software en bestandsformaat:
kies bestandsformaat dat niet afhankelijk is van een bepaald
softwarepakket.
3. WAT ZIJN DUURZAME
BESTANDSFORMATEN?
• ongecomprimeerde of mathematisch lossless gecodeerde
inhoud
• geen patenten op de gebruikte technologie
• ondersteuning door verschillende software tools
• eenvoudig en goed gedocumenteerd
3. WAT ZIJN DUURZAME
BESTANDSFORMATEN? CODERING FORMAAT
TEKST utf-8 XML
BEELD
TIFF v6.0 uncompressed baseline
lossless JPEG2000 pt.1 jp2
BEWEGEND
BEELD
JPEG2000 MXF
FFV1 MKV
GELUID LPCM
WAV
AIFF
FLAC
4. AUDIOVISUELE COLLECTIES OP
MAGNETISCHE DRAGERS?
• magnetische dragers hebben beperkte levensduur:
samenstelling + afspeelapparatuur
• (voorlopige) uitzondering: film
• digitaliseren in functie van preservering en ontsluiting
• behoud van informatie uit het origineel > vermijden van
lossy compressie
• keuze van duurzame containerformaat en codecs
5. JPEG OMZETTEN NAAR TIFF?
•JPEG en TIFF: patenten zijn vervallen
•grote onderscheid is lossy compressie
•omzetting van lossy compressie formaat in lossless
compressie formaat heeft geen zin zolang JPEG
ondersteund wordt > geen winst aan informatie, meer
opslagcapaciteit vereist
•wanneer transcodering / migratie wel aan de orde is, dan
naar lossless formaat > want opeenvolging van lossy
compressie op lossy compressie kan resulteren zichtbaar
kwaliteitsverlies
•opvolgen ondersteuning formaat is vereist (daarom aantal
archiveringsformaten beperkt houden)
6. ACCESS & EXCELL
• Bewerkingssoftware: complexe formaten
• veel functionaliteit
• nood aan nieuw snufjes > evalueert snel
• commercieel product > korte levensduur
• Excel > Access
• niet automatisch: van ‘plat’ naar ‘relationeel’
• handwerk
• Duurzaamheidsstrategie?
• gebruik eenvoudige generieke formaten (CSV, XML,
JSON)
• gebruik standaard data structuuren (DC, EAD,
MARC, etc…)
• open source software: ‘terugwaarts compatibel’
(leest ook oude formaten)
• Alternatieven?
• open databanksystemen:
• open/libre office calc/base
• mySQL/mariaDB
7. UNIFORM SOFTWAREPAKKET <>
WAAIER AAN SOFTWARE
•brede waaier aan software: geen kostendeling, moeilijk om
druk uit te oefenen op producent
•onderscheid tussen software en bestandsformaat
•openheid van software: kan data geëxporteerd worden?kan
de export in een bruikbaar formaat gebeuren?
•uniform uitwisselformaat is belangrijker dan uniforme
software
IV. ONBETROUWBARE &
VERGANKELIJKE DRAGERS
8. Regelmatige vaststelling dat digitale fotobestanden op
harde schijven beschadigd zijn? Hoe detecteren? Hoe
voorkomen?
9. Foto’s op CD-r’s overzetten op harde schijven?
Alle digitale bestanden op harde schijven? Hoe het risico op
verlies beperken? Wat zijn de alternatieven?
8. BESCHADIGDE FOTOBESTANDEN?
•maak checksums (MD5) in zo’n vroeg mogelijk stadium,
voor opslag op harde schijven
•controleer checksums onmiddellijk na opslag, en daarna
periodiek
•maak back-up kopieën op andere harde schijven, server, in
de cloud, … en doe ook daar controle op checksums
•wanneer een probleem opduikt met checksum, grijp dan
terug naar back-up
9. FOTO’S BEWAREN OP CD-r?
•CD-r’s en harde schijven zijn onbetrouwbare dragers
•back-ups maken
•checksums creëren en regelmatig controleren
•wanneer een probleem opduikt met checksum, grijp dan
terug naar back-up
•procedure efficiënter bij harde schijven, servers, in de cloud,
…
•ook cloud maakt gebruik van harde schijven, denk ook aan
paswoord, voorwaarden dienstverlening, …
•gecombineerde oplossing?
IV. ONDUIDELIJKE EN UITDIJENDE
OMVANG
10. Hoe kun je in Excel linken naar een pdf-afbeelding?
11. Grote hoeveelheid dragers en collecties die verspreid zijn
> inventariseren? Afspraken maken over wie wat bewaart?
12. Hoe bewaar je e-mails en bijlagen?
13. Hoe groeiende aantal schenkingen (documenten, boeken
en foto’s) te archiveren? Per dossier, per onderwerp of
overdragen aan andere instellingen?
10. LINKS IN EXCEL
• bestanden NIET plakken in EXCEL
• plak een path of webadres
• http:// link (file op een webserver)
• file:\\192.168.1.2\mijnhuiswerk.pdf (op een netwerklocatie)
• file:\\mijnhuiswerk.pdf (in dezelfde map)
11. VERSPREIDING DRAGERS &
COLLECTIES
• goed beheer vereist goede metadata
• minimale registratie > 12 CIDOC velden
• collectiebeschrijving > 27 COMETA BASIS velden
• identificeer coherente verzamelingen en collecties
• maak afspraken over beheer per verzameling of
collectieverantwoordelijkheid beheer afspreken
12. E-MAILS & ATTACHMENTS
BEWAREN?
• opslaan als eml, attachments en e-mails bij elkaar houden
• in cloud zetten biedt oplossing voor bewaarprobleem >
cloud service neemt die zorg over maar creëert ook
afhankelijkheid > export als eml is niet mogelijk
• e-mails binnentrekken in desktop e-mail client, hierin
oplossing om e-mails en attachments samen te houden bij
omzetting naar eml
13. (DIGITALE) SCHENKINGEN
• ‘oude’ orde bewaren
• verpakken in een digitale container (zip, bagit)
• checksum maken voor het pakket (MD5)
• schenking beschrijven (COMETA) in csv bestand
• opslaan in een netwerk met back-up
V. GEBREK AAN TOEGANG
14. Hoe bibliotheek in PDF te ontsluiten als eigen website
beperkt is?
15. Hoe best documenten publiceren op het web?
14. PDF PUBLICEREN ZONDER
WEBSITE
DIY:
•file-server (HTTP)
•op een specifiek domein
•mappen: titel-jaargang-volume
•persistente ID’s: titel-jaargang-volume
Publiek domein materiaal:
•wikisource.org > primaire bronnen
•gutenberg.org > literatuur
15. DOCUMENTEN PUBLICEREN OP
HET WEB?
1. Maak de beschrijvingen uniek en persistent
identificeerbaar
• verzeker voor elk object uniek identificatienummer
• gebruik enkel alfanumerieke tekens, hyphens en
underscores
• maak voor elk object een URI, bepaalt hoe object
op web genoemd wordt.
• leg syntax van URI formeel vast.
• gebruik een domeinnaam die je instelling
controleert
• maak gebruik van het HTTP-protocol om de URI te
koppelen aan een webpagina (landing page) met
de identificatiegegevens van het object
15. DOCUMENTEN PUBLICEREN OP
HET WEB?AAN TOEGANG
2. Geef aan welke intellectuele eigendomsrechten berusten
op het object
• bij elk object Credit Line die aangeeft of er
intellectuele rechten op object rusten en wie
rechten beheert
• bij elke digitale representatie Credit Line die
aangeeft wie intellectuele rechten op digitale
representatie beheert
• Geef aan onder welke voorwaarden inhoud van
webpagina beschikbaar gesteld wordt
15. DOCUMENTEN PUBLICEREN OP
HET WEB?
3. Maak website leesbaar voor verschillende browsers
• codeer inhoud van webpagina's in valide HTML
4.01 of later
• codeer vormgeving door gebruik van Cascading
Stylesheets
• gebruik voor digitale representaties
bestandsformaat dat goed leesbaar is en door
gangbare browsers wordt ondersteund
• zorg dat website toegankelijk is voor mensen met
fysieke beperking
4. Maak de webpagina vindbaar op het web
• correct gebruik van beschikbare HTML-elementen
• Plaats belangrijkste identificatiegegevens van
collectiestuk de hoofding van pagina.