IMPACT is supported by the European Community under the FP7 ICT Work Programme. The project is coordinated by the National Library of the Netherlands.


Kollaborative Korrektur Doris Škarić, Bayerische Staatsbibliothek, Münchener Digitalisierungszentrum/Digitale Bibliothek

� Definition

� State-of-the-Art

� IMPACT-Tool zur Kollaborativen Korrektur

– Demonstration des CONCERT-Tools

– Erfahrungsbericht

– Nutzen für Bibliotheken

Was ist kollaborative Korrektur?

� Kollaborativ: mehrere Personen arbeiten gemeinsam an einem Projekt, hier:


� Crowdsourcing: “kollaborative Leistungserbringung durch Freiwillige”

� Reihenfolge im Digitalisierungsprozess: nach automatischer Texterkennung

Wieso Textkorrekturen?

� V.a. bei historischen Material (keine normierte Rechtschreibung…) führt alleinige

Anwendung von OCR-Software zu oft nicht ausreichender Erkennungsrate

� Fehlerhafte Erkennung von Fraktur, z.B. langes s wird als f erkannt, z.B. Bifchof,


� einzelne fehlerhafte Buchstaben führen zu schlechter Worterkennung

� Buchstaben, „Signal-“wörter werden nicht erkannt

Andere Systeme zur kollaborativen Korrektur

� Australian Newspaper Digitisation


� ReCaptcha

� Mole Hunt

– Collaborative eNgine for the CorREction of Texts

– Web-basierte Plattform

– Geeignet für massenhafte Beteiligung von Freiweilligen (Crowdsourcing)

– Ergebnisse der Korrektur werden in den OCR-Prozess eingespeist („Adaptive OCR“)

– Korrektur auf drei Ebenen

– schnelle und effiziente Arbeitsweise

Pilotphase an der BSB

� 1-wöchiger Test mit ca. 15 Teilnehmern

� Fragestellungen:

– Usability

– Annahme durch Nutzer

– Erkennungsergebnisse

– Einbindung in Digitalisierungsprozess

� Insgesamt sehr positiv

� Nutzerwünsche:

mehr „Nutzermotivation“ und Rückmeldung

� Fortschrittsanzeige, Vergleich mit anderen Freiwilligen

� manche Wörter werden von der Texterkennung falsch erkannt und dadurch nie zur

manuellen Korrektur vorgelegt bzw. als fragwürdig erkannt

� Gothic und Antiqua in einem Text werden nicht erkannt

� mehr Metadaten für Bücher

Einsatzmöglichkeit für die Bibliotheken

� Verbesserung der Volltexte durch Nutzerbeteiligung

� Ermöglichung zeitintensiver Korrekturen

� schnellere Korrekturen (durch Bibliotheksnutzer oder Dienstleister)

� „Kundenbindung“

� Verknüpfung des Katalogtitels mit der Korrektursoftware, z.B.: helfen Sie uns den

Volltext dieses Buchs zu verbessern

Ausblick :

� Verbesserung des Bedienkomforts

� User Monitoring

� Motivierung der Nutzer

� Einbindung in Texterkennungs- und Bearbeitungsprozess

� Langzeitarchivierung

Vielen Dank für Ihre Aufmerksamkeit

Kontakt: [email protected]