obstor/rost
Heinz Werner Kramski:
Anforderungen aus der Praxis der Gedächtnisorganisationen –Deutsches Literaturarchiv Marbach
BSB München, 3.11.2008
Obstor/Rost
Heinz Werner Kramski:
Anforderungen aus der Praxis der Gedächtnisorganisationen –Deutsches Literaturarchiv Marbach
BSB München, 3.11.2008
Träger: Deutsche Schillergesellschaft e.V. (ca. 3.500 Mitglieder)Name: Deutsches Literaturarchiv MarbachGebäude: Schiller-Nationalmuseum, Deutsches Literaturarchiv,
Collegienhaus, Literaturmuseum der ModerneFinanzierung: Zuwendungsempfänger von Bund und Land B.-W.
(je rund 45%)Mitarbeiter: 99 Planstellen mit rund 180 MitarbeiternBenutzer 2007: ca. 9.000 Benutzungen aus 40 Ländern in beiden
Lesesälen; ca. 35.500 MuseumsbesucherAuftrag: Sammlung und Erschließung literarischer Quellen in
handschriftlicher und gedruckter, bildlicher und gegenständ- licher, audiovisueller und digitaler Form seit 1750.
DLA Marbach –
Campus
Eröffnung 1903Derzeit geschlossen wegen Innensanierung (Klimatisierung usw.)Wiedereröffnung 2009 zum SchillerjahrNeuer Schwerpunkt: 18. und 19. Jahrhundert
Schiller-Nationalmuseum
Gründung 1955 im Schiller-Nationalmuseum1973 Neubau als eigenes Gebäude1994 Erweiterungbau
Archiv
Neubau 1993 aus mäzenatischen MittelnUnterkunft für forschende Gäste
Collegienhaus
Eröffnung 2006Schwerpunkt: 20. und 21. Jahrhundert
Literaturmuseum der Moderne
Ca. 760.000 Bände(ca. 1,5 Mio. unselbständige Beiträge?)Zeitungsausschnitte, Rundfunk- und Fernsehmanuskripte, Theaterprogramme, Ton- und Bildträger
Bibliothek
Ca. 1.200 Nachlässe (und Vorlässe), Sammlungen, Zeitschriften- und Verlagsarchive
Ca. 50.000 Einzelautographen(ca. 10. Mio. Blatt?)
Handschriftenabteilung und Cotta-Archiv
Ca. 200.000 bildliche und gegenständliche Sammlungsobjekte
Kunstsammlungen
Vier MitarbeiterCa. 12 Server (Suse-Linux, Tru64-Unix)EVA4000 Enterprise Virtual Array, derzeit ca. 6 TBCa. 200 PCs (Windows)Ca. 50 Tablet-PCsHauptanwendungen (neben Office, Internet usw.): Integrierte
Bestandsverwaltung Kallías (auf Oracle-Basis), Typo3, Medien in den Museen, Retrokonversion der Kataloge, Digitalisierungsprojekte
EDV-Referat/EDV-Ausstattung
Obstor/Rost
Heinz Werner Kramski:
Anforderungen aus der Praxis der Gedächtnisorganisationen –Deutsches Literaturarchiv Marbach
BSB München, 3.11.2008
Digitale Dokumente:1. Volltexte, die durch Transkription oder Edition analoger Quellen
gewonnen werden• Standardverfahren• planbar• analoge bzw. schriftliche Quelle existiert parallel und bleibt
erhalten 2. Digitalisate analoger Quellen (Scans, Audiodigitalisate)
• siehe 1.Langzeitarchivierung der digitalen Formen mit verringertem Risiko
Digitale Nachlassteile: Abgrenzung
3. Digitale Dokumente, die online oder offline publiziert werden (Netzliteratur, CD-ROMs)• digitally born• nicht unikal• kooperative und redundante Sammlung möglich
4. Digitale Nachlassteile• digitale Unikate• „Ingest“ nicht mittels vereinbarter, kontrollierter Verfahren,
sondern ungeplant • Datenträger und Datenformate von physischem Zerfall bzw.
Obsoleszenz bedroht besondere Verantwortung für langfristige Erhaltung
Digitale Nachlassteile: Abgrenzung
Testfall: Nachlass von Thomas Strittmatter (erworben 2000)19 Archivkästen mit konventionellem MaterialEin Atari Mega ST2 (betriebsfähig)Eine Festplatte Atari Megafile 30 (defekt, aber Backup-Disketten
vorhanden)43 Disketten (Atari 3,5" einseitig, 360 KB; Atari 3,5" doppelseitig,
720 KB; Mac 3,5" 400 KB Zone Bit Recording; Mac, 3,5", 1,4 MB)
Aktueller Bestand: (F.C. Delius, Norbert Elias, Hermann Lübbe, Ernst Schnabel, ...) 107 Disketten 3,5“ PC, 66 5,25“ PC, ca. 46 Apple, 3 CD-ROMs (ca. 40% bearbeitet)
Digitale Nachlassteile: Mengen
Gemeinsamer Leitfaden EDV/Handschriftenabteilung (HSA):1. Erwerbung wie konventionelles Material (HSA)2. Beschriftung mit Bleistift: Bestand, Zugangsnummer, „Disk 01“
usw. (HSA)3. Identifizierung offenkundiger physischer Dubletten (alle
Datenträger bleiben jedoch als potentielle Ausstellungsstücke erhalten)
4. Image-Kopie (sofern Disketten), dabei Erfassung elementarer Metadaten (Beschreibung des Datenträgers, technische Daten), MD5-Prüfsumme (Raw-Device/Image), rekursives Dateilisting, Ablage im Filesystem als „0_Original-Disk/disk01“ usw. Tools: ddrescue etc. (Cygwin), eigene Scripte
Digitale Nachlassteile: Arbeitsschritte
5. Kopie der Originaldateien, Ablage im Filesystem als „1_Original/disk01 usw.“ (Änderungsdatum bleibt unverändert). Tools: Original-Hardware (Atari ST, Mac mit Superdrive), Virtual Floppy Drive, Transmac, Gemulator Explorer
6. Konversion der Originaldateien nach .rtf, .csv, .pdf, .xml. Ablage im Filesystem als „2_Konvertiert/disk01“. Tools: Original-Software, Tools in der Original-Umgebung, z.T. in Emulator, aktuelle Tools/Software
Digitale Nachlassteile: Arbeitsschritte
7. Übergabe einer Kopie von „2_Konvertiert“ als „3_Geordnet“ an die HSA (die nur dort Schreibrechte besitzt)
8. Darin Auflösen der „disknn“- Hierachie zugunsten einer Ablagestruktur nach dem Hausregelwerk („Memo“), Ergänzung aussagekräftiger Dateinamen (HSA)
Digitale Nachlassteile: Arbeitsschritte
9. Anlegen von Multimedia-Sätzen in Kallías als Verknüpfungen auf Dateien im Ordner „3_Geordnet“ (HSA/EDV)
10.Katalogisierung der digitalen Dokumente wie üblich (HSA)11.Verknüpfungen von Multimedia-Sätzen und Katalogisaten
(HSA)12.Zugriff für Benutzer nur vermittelt über Mitarbeiter, da keine
differenzierte Zugriffsrechtesteuerung besteht.
Digitale Nachlassteile: Arbeitsschritte
Obstor/Rost
Heinz Werner Kramski:
Anforderungen wird fortgesetzt um 14:30 Uhr
obstor/rost
Heinz Werner Kramski:
Anforderungen und Ziele einer Hardware-Registry
BSB München, 3.11.2008
Die beschriebene Praxis im DLA ist in vielen Punkten verbesserungsfähig (DMS statt Filesystem, differenzierte Zugriffsrechte, technische Metadaten usw.) Hier sollen am Ende aber Anforderungen (und Probleme) stehen, die sich verallgemeinern lassen:
1. Die Bearbeitung, insbesondere die Konvertierung ist sehr zeitaufwendig (87 ‚einfache‘ PC-Disketten & 1 CD-ROM: ca. 60 Arbeitsstunden). Evtl. Erleichterung durch besser Tools. Gewisse Tendenz zu erhöhter Interoperabilität zwischen den Herstellern?
2. Disketten können auf diese Weise bewältigt werden, USB-Sticks und (portable) Festplatten lassen für die Zukunft Schlimmes erwarten...Datenmenge nimmt weiter zu, sammlungsrelevante Privatvideos in exotischen Codecs von Autoren werden kommen.
Anforderungen/Probleme aus der Praxis
3. Die Konvertierung muss oft stattfinden, bevor eine fundierte Auswahl der Archivalien getroffen werden kann. (Strittmatters 400-KB-Disketten enthielten nur dublette Dateien...).Möglichst bewusste Auswahl in der Erwerbungsphase.
4. Erwerbungsverhandlungen und -Vorgänge müssen die verwendete Rechnerumgebung mit berücksichtigen (Kennwörter für webbasierte (Mail-)dienste!)Hausintern Bewusstsein schärfen und EDV-Know-How stärken.
5. Für die erstmalige Übernahme und Konvertierung wird idR. die Original-Hardware und -Software benötigt und das Know-How, damit umzugehen. Hardware, Software und Know-How sind zum Zeitpunkt der Erwerbung jedoch häufig obsoleszent oder obsolet.obstor/rost (OBsolescent STOrage Registry/Register Obsoleszenter SpeicherTechniken)
Anforderungen/Probleme aus der Praxis
6. Die erfreulich fortgeschrittene Diskussion um LZA berücksichtigt den singulären, kritischen Vorgang der ersten Datenübernahme in (Literatur-)Archiven zu wenig, da Bibliotheken idR. mit aktuellen (eher zu avantgardistischen) Techniken konfrontiert sind.nestor, obstor/rost(?)
7. Für die (technische) Beschreibung von Datenträgern und Lesegeräten (verwendet das DLA | gibt es) kein einschlägiges standardisiertes Metadatenformat. (KoLibRI/METS: Ingest von Dateien, nicht von Datenträgern)nestor, obstor/rost(?)
8. Tools zur automatischen Ermittlung technischer Metadaten (DROID, JHOVE) und Format-Registries berücksichtigen Office-Formate zu wenig (das Linux „file“-Kommando identifiziert weitaus mehr).nestor, obstor/rost(?)
Anforderungen/Probleme aus der Praxis
Wenn eine potentielle Archivalie als Offline-Datenträger/ Speichermedium vorliegt, so muss diese für jede weitere Form der Verarbeitung/Langzeit- archivierung zunächst auf einer elementaren Stufe gelesen werden können. Voraussetzung für diesen elementaren Lesevorgang ist ein funktionsfähiges Lesegerät in einer lauffähigen Umgebung.
Während sich für Dateiformate eine Infrastruktur bildet (PRONOM etc.), fehlt unseres Wissens ein vergleichbares Register für die Hardware- Ebene. Da der Archivierungsvorgang in vielen Fällen erst erfolgen wird, wenn Speichermedien und Lesegeräte ungebräuchlich und schwer verfügbar geworden sind, ist aber ein zentrales Register obsoleszenter Speicher ein Desiderat, dass im Rahmen der nestor-AG Kooperative Langzeitarchivierung angeregt oder betrieben werden könnte.
Grundidee obstor/rost
Deshalb:Stufe 1: Kontaktbörse (Biete-Suche) und Auflistung von Experten und
Betreibern obsoleszenter Lesegeräte, die über Know-how verfügen und kooperativ konkrete Hilfe leisten können. Community-Aufbau und - Pflege. Exemplarisches eigenes Hilfsangebot.
Stufe 2: Datenbank von Datenträgern, Lesegeräten und ihrer typischen Betriebsumgebung, um den technischen Aufwand des Einlesens und das Obsoleszenzrisiko einschätzen zu können. Ggf. Online- Expertensystem zur Identifizierung unbekannter Datenträger.
Stufe 3: Formale Ontologie und Infrastruktur für eine obstor-ID für Speichermedien (ähnlich einer PRONOM-ID für Dateiformate); Integration von PRONOM und ähnlichen Initiativen. Ausweitung auf Audio- und Videoträger und analoge Speichertechniken.
„If you think big enough, you‘ll never have to do it.“ (Reissner's Rule of Conceptual Inertia)
Datenmodell (Fragment)
Lesegerät
PK LG_ID
KurzbezeichnungBezeichnungBeschreibungVerwendung vonVerwendung bisSchnittstellleStromversorgung
FK1 RS_IDFK2 HS_IDFK3 EX_ID
Hersteller
PK HS_ID
KurzbezeichnungBezeichnungBeschreibung
Systematik
PK SY_ID
EbeneKurzbezeichnungBezeichnungBeschreibungÜbergeordneter_Eintrag
FK2 LG_IDFK3 DT_ID
Datenträger
PK DT_ID
KurzbezeichnungBezeichnungBeschreibungVerwendung vonVerwendung bisKapazität (KB)Physische AbmessungenSchnittstelle (ggf.)Bandlänge (ggf.)Bandbreite (ggf.)[...]LZA-Risiko
FK1 LG_IDFK2 HS_ID
Experte
PK EX_ID
NameKontaktdaten
Rechnersystem
PK RS_ID
KurzbezeichnungBezeichnungBeschreibungVerwendung vonVerwendung bis
FK1 HS_IDFK2 EX_ID
Systematik/Ontologie (Fragment)
Zielgruppe mit konkretem Bedarf?- Archivare, Bibliothekare oder Kuratoren und ggf. deren IT-
Kollegen, die in ihrer Tätigkeit mit der Langzeitarchivierung von digitalen Offline-Datenträgern befasst sind.
Betriebsmodell, Trägerschaft, wissenschaftliche Begleitung?Redaktionell betreutes System vs. Wikimodell?Streben nach Vollständigkeit vs. anlassbezogene Einträge?Mehrsprachigkeit?Kooperationen und nutzbare Vorarbeiten?Technische Basis?Weiteres Vorgehen?Projektname ;-)
Einige offene Fragen
Schlusswort
„Es füllt sich der Speicher mit köstlicher Habe...“(Friedrich Schiller, Das Lied von der Glocke)
Sorgen wir dafür, das wir auch morgen noch problemlos zugreifen können!
Deutsche Schillergesellschaft e.V.Schiller-NationalmuseumDeutsches LiteraturarchivLiteraturmuseum der Moderne
www.dla-marbach.de
Top Related