Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

24
Was wir HEUTE beachten müssen ...um die Wissenschaftler in 10 Jahren nicht zu enttäuschen Dipl. Sozw. Ralf Stockmann, SUB Göttingen

description

Vortrag zur Verbundkonferenz 2009 des GBV. Workshop 4: FAG Technische Infrastruktur

Transcript of Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Page 1: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Was wir HEUTE beachten müssen

...um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Dipl. Sozw. Ralf Stockmann, SUB Göttingen

Page 2: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen
Page 3: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

TheseDer Umgang mit digitalen Daten wird die Wissenschaften genauso verändern wie der Buchdruck

Aber: es gibt nicht „DIE Wissenschaft“ sondern viele Disziplinen mit teils gegensätzlichen Anforderungen und Erwartungen

Page 4: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Zoologie vs. Wissenschaftsgeschichte

ZoologieVerzeichnis der Erstbeschreibungen von Tieren

Sehr schneller Zugriff auf gut ausgezeichnete Seiten (nicht: Seitenzahlen, Kapitel)

Best practice: kleine bitonale Scans, <1 Sekunde für Seitenwechsel, kein Download

WissenschaftsgeschichteDetailanalye einzelner Seiten, Feinheiten wie Wasserzeichen interessant

Best practice: hochauflösende Farbscans, Downloadmöglichkeit der vollen Auflösung, Online-Editor für Bildmanipulationen (MPI für Wiss.Gesch.)

Page 5: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Digital != Digital

Astrophysik: die NASA hat bereits alles digitalisiert

Medizin: digitalisierte Bücher töten Menschen

Page 6: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Dimensionen der Digitalisierung

Page 7: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Verfügbarkeit„Es ist da, ich kann es finden und nutzen“

24 / 7

Fehler werden auftreten und sind nicht zu verhindernEuropeana

Internet-Manifest

Klare Kommunikationsstrategien über Ausfälle

Indexierbar / Harvestbar denn: verfügbar ist das, was ich finde ohne es gesucht zu haben

Reaktion auf Nutzereingaben: < 1 Sek, max. 3 Sek

Bedienung

Page 8: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Bedienung ist ein Teil von Verfügbarkeit!

10% für GUI / Design

Projektkosten

Page 9: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Broken by Design

Attention to Detail!

Page 10: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen
Page 11: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Dimensionen der Digitalisierung

Page 12: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Qualität

Orientierung an Praxisregeln der DFG

300 dpi Farbe, 600 dpi bitonal„echte“ optisch aufgelöste dpi!

Farbkalibrierung?Farbkeil reicht

Bestmögliche Bildqualität pro Kilobyte Dateigröße

JPG2000 ?

Bildoptimierung nur wo es sinnvoll istEntzerrung fragwürdig

Qualitätskontrolle: Vollständigkeit, dem Ziel angemessen

Page 13: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Dimensionen der Digitalisierung

Page 14: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Semantik

Korrigierte bibliographische DatenDigitalisierung als Maßnahme der Katalogshygiene

Volltexte zu vertretbaren Preisen< 1 Cent pro Seite

Fraktur OCR läuft uns nicht weg: 5 Jahre warten

Keine händischen Korrekturen, lieber regelmäßig Fortschritte der Technik nutzen

Kollaborative Ansätze unterstützen (Wiki Source)

Page 15: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

„kluger“ Volltext

Nicht in Suchindex verstecken, sondern neben Digitalisat präsentieren

Beurteilung von Qualität der OCR und damit der Verlässlichkeit der Suche

Wortkoordinaten

Download im TEI Format

Adressierbarkeit beliebig granularer Einheiten (Kapitel, Absatz, Satz, ...)

Erschlossen durch NormdatenPND,

Page 16: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Experiment: Erschließung

Einheitlicher Suchraum (GDZ Bestand, 10.000 Bände)

Einheitliche Suchstrategien

Verschiedene Suchindizes:Bibliographische Daten

Strukturmetadaten

Volltexte

Fragestellungen:Signifikante Unterschiede?

Komplementäre Treffersets?

Treffersets Teilmengen voneinander?

Ergebnisse: Anfang 2010

Bibliog

raph

ische

Met

adat

en

Strukt

urm

etad

aten

Vollte

xt

Page 17: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Dimensionen der Digitalisierung

Page 18: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Verwertbarkeit

Flexible AusgabeformatePDF

Online-Pageturner

Zoom-Funktion

AdressierbakeitPersistente Identifier / PURLs

Markups

Page 19: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Augumented Reality

Page 20: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Überwindung der Provinienz

Es interessiert keinen Wissenschaftler, in welcher Bibliothek seine Forschungsliteratur steht.

Noch viel weniger interessiert ihn, in welchem Repository er die digitale Fassung gefunden hat.

Digitale Werkzeuge MÜSSEN system- und applikationsübergreifend funktionieren:

Bookmarking

Vernetzung

Kommentierung

Kollaboration

Page 21: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

ACHTUNG!

Wir versündigen uns an einer ganzen Generation von Wissenschaftlern, wenn wir Produktkonkurrenz auf dem Rücken der Forscher austragen

Wir brauchen keinen Wettbewerb um lokal implementierte Features, sondern einen Wettbewerb um die beste Implementierung offener Standards

Im Zweifelsfall werden die Wissenschaftler in Zukunft dahin gehen wo Vernetzung funktioniert (Google)

Page 22: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Rundumlösung vs. vernetze Dienste

Google:Suche

Mail

Maps

Kalender

News

Docs

Picasa (Bilder)

Nur durch ein Single Sign On verbunden

Page 23: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

ToDo‘s

Digitalisierung in hoher Qualität (Digital Master)

Mehrere Derivate für unterschiedliche Nutzungsszenarien anbieten

So viele (Meta)Daten wie möglich freigeben

Systematisch „kluge“ OCR vorantreiben

Softwareentscheidungen nicht (nur) danach treffen welche Features angeboten werden sondern welche Schnittstellen

Page 24: Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Vielen Dank