Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Post on 11-May-2015

1.016 views 3 download

description

Vortrag zur Verbundkonferenz 2009 des GBV. Workshop 4: FAG Technische Infrastruktur

Transcript of Was wir HEUTE beachten müssen um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Was wir HEUTE beachten müssen

...um die Wissenschaftler in 10 Jahren nicht zu enttäuschen

Dipl. Sozw. Ralf Stockmann, SUB Göttingen

TheseDer Umgang mit digitalen Daten wird die Wissenschaften genauso verändern wie der Buchdruck

Aber: es gibt nicht „DIE Wissenschaft“ sondern viele Disziplinen mit teils gegensätzlichen Anforderungen und Erwartungen

Zoologie vs. Wissenschaftsgeschichte

ZoologieVerzeichnis der Erstbeschreibungen von Tieren

Sehr schneller Zugriff auf gut ausgezeichnete Seiten (nicht: Seitenzahlen, Kapitel)

Best practice: kleine bitonale Scans, <1 Sekunde für Seitenwechsel, kein Download

WissenschaftsgeschichteDetailanalye einzelner Seiten, Feinheiten wie Wasserzeichen interessant

Best practice: hochauflösende Farbscans, Downloadmöglichkeit der vollen Auflösung, Online-Editor für Bildmanipulationen (MPI für Wiss.Gesch.)

Digital != Digital

Astrophysik: die NASA hat bereits alles digitalisiert

Medizin: digitalisierte Bücher töten Menschen

Dimensionen der Digitalisierung

Verfügbarkeit„Es ist da, ich kann es finden und nutzen“

24 / 7

Fehler werden auftreten und sind nicht zu verhindernEuropeana

Internet-Manifest

Klare Kommunikationsstrategien über Ausfälle

Indexierbar / Harvestbar denn: verfügbar ist das, was ich finde ohne es gesucht zu haben

Reaktion auf Nutzereingaben: < 1 Sek, max. 3 Sek

Bedienung

Bedienung ist ein Teil von Verfügbarkeit!

10% für GUI / Design

Projektkosten

Broken by Design

Attention to Detail!

Dimensionen der Digitalisierung

Qualität

Orientierung an Praxisregeln der DFG

300 dpi Farbe, 600 dpi bitonal„echte“ optisch aufgelöste dpi!

Farbkalibrierung?Farbkeil reicht

Bestmögliche Bildqualität pro Kilobyte Dateigröße

JPG2000 ?

Bildoptimierung nur wo es sinnvoll istEntzerrung fragwürdig

Qualitätskontrolle: Vollständigkeit, dem Ziel angemessen

Dimensionen der Digitalisierung

Semantik

Korrigierte bibliographische DatenDigitalisierung als Maßnahme der Katalogshygiene

Volltexte zu vertretbaren Preisen< 1 Cent pro Seite

Fraktur OCR läuft uns nicht weg: 5 Jahre warten

Keine händischen Korrekturen, lieber regelmäßig Fortschritte der Technik nutzen

Kollaborative Ansätze unterstützen (Wiki Source)

„kluger“ Volltext

Nicht in Suchindex verstecken, sondern neben Digitalisat präsentieren

Beurteilung von Qualität der OCR und damit der Verlässlichkeit der Suche

Wortkoordinaten

Download im TEI Format

Adressierbarkeit beliebig granularer Einheiten (Kapitel, Absatz, Satz, ...)

Erschlossen durch NormdatenPND,

Experiment: Erschließung

Einheitlicher Suchraum (GDZ Bestand, 10.000 Bände)

Einheitliche Suchstrategien

Verschiedene Suchindizes:Bibliographische Daten

Strukturmetadaten

Volltexte

Fragestellungen:Signifikante Unterschiede?

Komplementäre Treffersets?

Treffersets Teilmengen voneinander?

Ergebnisse: Anfang 2010

Bibliog

raph

ische

Met

adat

en

Strukt

urm

etad

aten

Vollte

xt

Dimensionen der Digitalisierung

Verwertbarkeit

Flexible AusgabeformatePDF

Online-Pageturner

Zoom-Funktion

AdressierbakeitPersistente Identifier / PURLs

Markups

Augumented Reality

Überwindung der Provinienz

Es interessiert keinen Wissenschaftler, in welcher Bibliothek seine Forschungsliteratur steht.

Noch viel weniger interessiert ihn, in welchem Repository er die digitale Fassung gefunden hat.

Digitale Werkzeuge MÜSSEN system- und applikationsübergreifend funktionieren:

Bookmarking

Vernetzung

Kommentierung

Kollaboration

ACHTUNG!

Wir versündigen uns an einer ganzen Generation von Wissenschaftlern, wenn wir Produktkonkurrenz auf dem Rücken der Forscher austragen

Wir brauchen keinen Wettbewerb um lokal implementierte Features, sondern einen Wettbewerb um die beste Implementierung offener Standards

Im Zweifelsfall werden die Wissenschaftler in Zukunft dahin gehen wo Vernetzung funktioniert (Google)

Rundumlösung vs. vernetze Dienste

Google:Suche

Mail

Maps

Kalender

News

Docs

Picasa (Bilder)

Nur durch ein Single Sign On verbunden

ToDo‘s

Digitalisierung in hoher Qualität (Digital Master)

Mehrere Derivate für unterschiedliche Nutzungsszenarien anbieten

So viele (Meta)Daten wie möglich freigeben

Systematisch „kluge“ OCR vorantreiben

Softwareentscheidungen nicht (nur) danach treffen welche Features angeboten werden sondern welche Schnittstellen

Vielen Dank