Abschlussbericht Grimm

download Abschlussbericht Grimm

of 48

Transcript of Abschlussbericht Grimm

  • 7/26/2019 Abschlussbericht Grimm

    1/48

    Hans-Werner Bartz, Thomas Burch, Ruth Christmann, Kurt Grtner,Vera Hildenbrandt, Thomas Schares, Klaudia Wegge

    Abschlubericht

    Das Deutsche Wrterbuchvon Jacob und Wilhelm Grimmauf CD-ROM und im Internet

    Gefrdert durch die DFG im Rahmen des Programms

    Retrospektive Digitalisierung von BibliotheksbestndenNovember 1998 bis Oktober 2003

  • 7/26/2019 Abschlussbericht Grimm

    2/48

    2

    Inhalt

    Vorbemerkungen 3

    1 Ein Wrterbuch zum Hausbedarf: Zur Digitalisierung desDeutschen Wrterbuchs 5

    2 Datenerfassung und Fehlerkorrektur 8

    3 Kodierung mit SGML nach den Richtlinien der TEI 16

    3.1 Auszeichnung nach internationalen Standards: SGML/TEI 163.2 Sukzessive Datenkodierung 16

    Auszeichnung mit Hilfe von TUSTEP 17

    Datenkodierung im topdown-Verfahren 17Kodierung der Artikelstruktur 18Unterscheidung der Trenn- und Bindestriche 21Auszeichnung der Stichwrter in Reihen- oder Nestartikeln 21

    3.3 Auszeichnung des Quellenverzeichnisses 24

    4 Die elektronische Publikation 25

    4.1 Datenbanken 264.2 Publikation im Internet 294.3 Publikation auf CD-ROM 31

    5 Publikationen und ffentlichkeitsarbeit 34

    5.1 Projektprsentationen 345.2 Publikationen 365.3 Kolloquium in der Akademie der Wissenschaften und der

    Literatur Mainz am 15./16. Mai 2003 39

    6 Der digitale Grimm auf derDocumenta11in Kassel, 8. Juni bis15. September 2002 40

    7 Berichte in Presse, Internet, Rundfunk und Fernsehen 41

    8 Perspektiven 45

    Anhang: SGML-Dokumentation (Tabelle) 49

  • 7/26/2019 Abschlussbericht Grimm

    3/48

    3

    Vorbemerkungen

    An der Universitt Trier wurde von November 1998 bis Juli 2004 die Erstbearbei-tung des Deutschen Wrterbuchs (DWB) der Brder Grimm digitalisiert und freine elektronische Publikation aufbereitet. Seit Juni 2002 ist das digitale DWB imInternet allgemein zugnglich, im Juli 2004 wurde es durch den Verlag Zweitau-sendeins (http://www.zweitausendeins.de) auf CD-ROM mit erweiterten Recher-chefunktionen verffentlicht. Die Projektziele wurden damit erreicht.

    Fr die Durchfhrung des Projekts war ein Zeitraum von insgesamt sechs Jah-ren vorgesehen, fr eine Frderung durch die Deutsche Forschungsgemeinschaft(DFG) im Rahmen ihres Programms Retrospektive Digitalisierung von Biblio-

    theksbestnden wurden fnf Jahre mit zwei zweijhrigen und einer abschlieen-den einjhrigen Frderphase veranschlagt. Der Erstantrag an die DFG wurde nacheiner im Januar 1998 positiv beschiedenen Voranfrage am 7.4.1998 eingereicht undam 14.9.1998 bewilligt. Auch die beiden Fortsetzungsantrge wurden bewilligt, soda die durch die DFG gefrderten Arbeiten zgig und ohne Unterbrechung durch-gefhrt und die in den Frderantrgen aufgestellten Arbeits- und Zeitplne weitest-gehend eingehalten werden konnten.

    Das Projekt wurde mit der Untersttzung des vom Land Rheinland-Pfalz ge-frderten Kompetenzzentrums fr elektronische Erschlieungs- und Publikations-verfahren in den Geisteswissenschaften an der Universitt Trier durchgefhrt. Die

    Zusammenarbeit mit diesem Zentrum, das auch das von der DFG gefrderte lexi-kographische Vorgngerprojekt, den digitalen Verbund mittelhochdeutscher Wr-terbcher (www.MWV.uni-trier.de) betreute, wurde in hohem Mae begnstigtdurch die Kumulierung von vergleichbaren Projekten und die dadurch ermglichtenSynergieeffekte. Besonders bedeutsam war die enge Zusammenarbeit mit den Mit-arbeitern des Vorgngerprojekts, die ihre Erfahrungen und Kompetenzen wir-kungsvoll vermitteln konnten. Das Kompetenzzentrum wird die geplanten Updatesdes digitalen DWB mitentwickeln. Die langfristige Pflege der im Projekt erarbeite-ten Daten wird durch die Abteilung Elektronische Medien der Universittsbiblio-

    thek Trier bernommen. Die Kommission fr deutsche Philologie der Akademieder Wissenschaften und der Literatur Mainz wird auch bei der Weiterentwicklungdes digitalen DWB beratend ttig sein.

    Im folgenden Abschlubericht fr die DFG soll ausfhrlich ber die Konzep-tion des Projekts, die Hauptarbeitsschritte, die Projektpublikationen und die ffent-lichkeitsarbeit, die Prsentation des digitalen DWB als Exponat auf der Documen-ta11und die weiteren Perspektiven, die sich durch die Schaffung und Weiterent-wicklung des elektronischen DWB erffnen, berichtet werden. Die im Anhang zu-

  • 7/26/2019 Abschlussbericht Grimm

    4/48

    4

    sammengestellte SGML-Dokumentation gibt einen Einblick in die Komplexitt derArbeiten und Aufgaben, die im Bereich des elektronischen Publizierens auf interna-tionalem Niveau zu bewltigen sind. Der Bericht ist von den im Projektteam ttigenWissenschaftlichen Mitarbeiterinnen und Mitarbeitern und dem Antragsteller ge-meinsam verfat.

    Zum erfolgreichen Abschlu des Projekts haben viele Personen und Institutio-nen beigetragen, denen fr ihre Untersttzung zu danken ist. Ausfhrliche Danksa-gungen an die das Projekt untersttzenden Personen und die Kooperationspartnerfinden sich in meiner Einleitung zum Begleitband der CD-ROM, S. 19-23 (vgl. 5.2Publikationen). Ausdrcklich genannt werden sollen hier die Universitt Trier, dieMainzer Akademie und besonders das Ministerium fr Wissenschaft, Weiterbil-dung, Forschung und Kultur des Landes Rheinland-Pfalz, das durch erhebliche fi-nanzielle Untersttzung im Rahmen seiner Frdermanahmen zur Einrichtung vonKompetenzzentren die Grndung des Trierer Kompetenzzentrums fr elektroni-

    sche Erschlieungs- und Publikationsverfahren in den Geisteswissenschaften unddamit die zur Durchfhrung des Projekts entscheidende interdisziplinre Zusam-menarbeit zwischen Informatikern und Geisteswissenschaftlern ermglichte. Vorallem ist schlielich der Deutschen Forschungsgemeinschaft fr eine effiziente An-tragsberatung und die entscheidende und grozgige Frderung zu danken. Sie er-laubte es der Trierer Arbeitsgruppe, die Mglichkeiten der neuen Informations- undKommunikationstechnologie konsequent und kreativ zu nutzen und so die konkur-renzlose Informationsflle, die das Deutsche Wrterbuch zur deutschen Sprache

    bietet, in der digitalen Version in ganz neuer Weise zu erschlieen und in eine Ver-teilte Digitale Forschungsbibliothek einzubringen.

    Trier, im September 2004 Kurt Grtner

  • 7/26/2019 Abschlussbericht Grimm

    5/48

    5

    1 Ein Wrterbuch zum Hausbedarf:

    Zur Digitalisierung desDeutschen Wrterbuchs

    Das von Jacob und Wilhelm Grimm begrndete Deutsche Wrterbuch(DWB) mitseinen von 1854 bis 1960 erschienenen 32 Wrterbuchbnden und dem 1971 ineinem weiteren Band verffentlichten Quellenverzeichnis bietet die bei weitem um-fangreichste Erfassung der deutschen Sprache. Whrend der langen Bearbeitungs-zeit haben Generationen von Lexikographen etwa 325.000 Stichwrter auf rund70.000 Spalten behandelt; das Quellenverzeichnis enthlt mehr als 25.000 Titel undVerweise.

    Im Jahr 1838 konnten die Brder Grimm vom Leipziger Verleger Salomon

    Hirzel fr den Plan eines groen neuhochdeutschen Wrterbuchs gewonnen werdenund fanden sich nach den Kinder- und Hausmrchen(1812/15) noch einmal zu ei-ner gemeinsamen Arbeit zusammen. Daraus sollte wieder ein Werk fr a l l e wer-den; sein Gegenstand sollte die Darstellung des hochdeutschen schriftsprachlichenWortschatzes sein in seiner Entwicklung und seinem Gebrauch von der Mitte des15. Jahrhunderts, d. h. von der Erfindung des Buchdrucks um 1450 und die dadurchausgelste massenhafte Verbreitung von Literatur, bis zur Bearbeitungsgegenwart,die fr die Brder noch durch die sprachmchtige Gestalt Goethes bestimmt war.Sie wollten mit ihrem Werk ein Hausbuch fr leser jedes standes und alters, einwrterbuch zum hausbedarf schaffen (Band I, Vorrede, Sp. XIIf.), das sich imBesitz eines jeden an der deutschen Sprache Interessierten befinden und innerhalbder Familien zur Erbauung gelesen werden sollte.

    Als die Brder, die 1838 bereits Anfang fnfzig waren, mit der Ausarbeitungdes Wrterbuchs begannen, veranschlagten sie dessen Umfang auf sechs bis siebenBnde, die Arbeitszeit auf zehn Jahre. Erst 1854 jedoch lag der 1. Band abge-schlossen vor, und allein die drei ersten Bnde und der Anfang des vierten beschf-tigten die Brder bis an ihr Lebensende: Wilhelm vollendete die BuchstabenstreckeD kurz vor seinem Tode 1859, Jacob gelangte bis zum Artikel FRUCHT im An-fangsteil des vierten Bandes. Die Fortsetzung des Werks erfolgte unter wechseln-

    den wissenschaftlichen und politischen Umstnden, und erst 1960 wurde das Un-ternehmen in einer gemeinsamen Anstrengung von Ost und West durch die Berlin-Brandenburgische und die Gttinger Akademie der Wissenschaften abgeschlossen.

    Durch die lange Bearbeitungszeit wurde das DWB zu einem unvergleichli-chen Zeugnis fr die Entwicklung wissenschaftlicher Theorien und Methoden des19. und 20. Jahrhunderts, die die Arbeit verschiedener Lexikographengenerationen

    prgten, und durch Anlage und Umfang wurde es zu einem worthistorischenGrundlagenwerk der deutschen Sprache und zu einem gewaltigen Informations-

  • 7/26/2019 Abschlussbericht Grimm

    6/48

    6

    speicher fr sprachwissenschaftliche Forschungen. Bedingt durch die lange Ausar-beitungszeit wurde es aber auch ein sehr heterogenes Werk. Diese Heterogenitthat jedoch nicht verhindert, da dem DWB ein ungebrochenes Interesse entgegen-gebracht wird. Dies wird durch den zwischen 1984 und 1999 bereits in vier Aufla-gen erschienenen fotomechanischen Nachdruck, der bei dtv erschien, besttigt.Dieser eroberte die Gelehrtenstuben und verhalf dem Werk trotz des kleinen, demnormalen Auge gerade noch zumutbaren Schriftgrades und trotz der unterschiedli-chen Artikelstrukturen und Artikelumfnge zu einem beispiellosen Erfolg in derakademischen Welt. Fr die meisten Benutzer des vielbndigen Growrterbuchswar dennoch bis vor kurzem der Gang in die nchste ffentliche Bibliothek unver-meidlich.

    Um die allgemeine Verfgbarkeit des bedeutendsten nationalsprachlichenWrterbuchs des Deutschen noch weiter zu erhhen und das DWB zu einem wirk-lich populren Werk, zu einem wrterbuch zum hausbedarf im Sinne Jacob

    Grimms zu machen und seine Benutzung in vieler Hinsicht von der Lesbarkeitund bersichtlichkeit bis zur Einrichtung neuartiger Zugriffsstrukturen erheblichzu erleichtern, lag es nahe, eine Digitalisierung dieses wichtigen Grundlagenwerksin Angriff zu nehmen. Gerade die elektronischen Medien bieten die Mglichkeit,dem groen Wrterbuch eine vor wenigen Jahren noch nicht vorstellbare Verbrei-tung zu sichern und damit das Vermchtnis der Brder Grimm, denen die Populari-tt des von ihnen begonnenen Werks ein erklrtes Ziel war, zu erfllen.

    Der von Jacob Grimm gehegte Traum, das Wrterbuch knnte zum hausbe-darf, und mit verlangen, oft mit andacht gelesen werden (Band I, Vorrede,Sp. XIII), ist nun greifbarer denn je, nachdem der PC und ein Anschlu an das In-ternet immer mehr zur Ausstattung auch eines gewhnlichen Haushalts gehren.Durch die elektronische Publikation des DWB im Internet und mit erweitertenRecherchefunktionen als Offlinemedium wird dieses fr den Wissenschaftler undalle an der deutschen Sprache und ihrer Geschichte Interessierten wichtige Werknicht nur unabhngig von den ffnungszeiten der Bibliotheken einem groen Be-nutzerkreis zugnglich gemacht, sondern auch in seinem ganzen Reichtum an In-formationen erschlossen. Das ber die alphabetische Anordnung der Stichwrterfhrende und dem Druckwerk nachempfundene Nachschlagen wird ergnzt durcheine Vielzahl von Recherchemglichkeiten, die von der einfachen Volltextsuche

    bis zu gezielt auf einzelne oder mehrere Informationspositionen eingrenzbarenSuchvorgngen reichen. Das elektronische DWB kann ebenso als umfangreichstesrcklufiges Wrterbuch der deutschen Sprache benutzt werden wie als Morphem-wrterbuch.

    Der Erfolg der ersten Internetversion, die im Januar 2002 fr die BuchstabenA bis G zur Verfgung gestellt werden konnte, und der vollstndigen Internetversi-on, die seit Juni 2002 zugnglich ist, spiegelt sich in den stndig wachsendenZugriffszahlen. Durch die in Kooperation mit Ecke Bonk entwickelte Prsentation

  • 7/26/2019 Abschlussbericht Grimm

    7/48

  • 7/26/2019 Abschlussbericht Grimm

    8/48

    8

    fentlichkeitsarbeit dokumentiert (5). Gesondert wird ber den groen Erfolg desdigitalen DWB auf derDocumenta11berichtet, der das Projekt national und inter-national bekannt machte (6). Die Pressereaktionen werden aufgefhrt (7) und zumSchlu die Perspektiven aufgezeigt (8), die sich fr die weitere Bearbeitung der Da-ten des digitalen DWB und seine mgliche Verbindung mit anderen abgeschlosse-nen oder geplanten Projekten im Rahmen einer attraktiven Verteilten DigitalenBibliothek bieten. Die SGML-Dokumentation im Anhang soll noch einmal vorAugen fhren, welche Herausforderungen in dem Projekt zu bewltigen waren, dasnicht auf die allgemein bevorzugte, aber nur wenig mehr als die herkmmlicheBuchform bietende Imagedigitalisierung setzte, sondern auf die Volltextdigitalisie-rung, um so die Mglichkeiten der neuen Technologie voll zu nutzen und eine wis-senschaftlich anspruchsvolle und zugleich populre digitale Ressource zu schaffen.

    2 Datenerfassung und Fehlerkorrektur

    Am 1. November 1998 wurde mit der Digitalisierung des DWB begonnen. EineImagedigitalisierung kam fr das beraus komplexe DWB nicht in Frage, da sielediglich die Mglichkeit bietet, ber Metadaten auf das digitale Bild, d.h. auf einelektronisches Faksimile etwa einer Wrterbuchseite, zuzugreifen, nicht aber aufeinzelne Zeichenfolgen. Wir entschieden uns daher fr eine Volltextdigitalisierung,die den Zugriff auf jedes einzelne Zeichen erlaubt und somit Ausgangsbasis fr ei-nen umfassenden Zugriff auf die Wrterbuchdaten ist.

    Fr die Volltextdigitalisierung mute zunchst die Art der Erfassung geklrtwerden. Ein naheliegender Weg knnte z. B. darin bestehen, den Text mittels einesScanners erfassen zu lassen, der in einem ersten Schritt den Text abtastet und dieeinzelnen Druckzeichen in Form eines aus Punkten (Pixels) bestehenden Bildesabspeichert; in einem zweiten Schritt vergleicht eine spezielle Software fr opti-sche Zeichenerkennung (Optical Character Recognition = OCR) die einzelnenBuchstabenbilder mit einem Katalog von Mustern. Durch den Vergleich werden dieBilder durch eine digitale Reprsentation ersetzt, die der Computer weiterverarbei-ten kann.

    Entgegen landlufigen Ansichten und entgegen nachdrcklichen Empfehlun-gen kam das OCR-Verfahren fr die Erfassung des DWB nicht in Frage, denn auf-grund der mangelhaften Druckqualitt vieler DWB-Bnde, der vielen Sonderzei-chen und der wechselnden Schriftarten und Schriftgren war ein sehr hoher Pro-zentsatz an nicht erkannten und nachtrglich einzufgenden oder zu verbesserndenZeichen zu erwarten. Zudem htte man alle 67.744 Spalten auf herkmmliche Wei-se gegen die Druckfassung korrekturlesen mssen; da aber Korrekturleser bei ei-nem Durchgang in der Regel lediglich 70% der Fehler erkennen, wren zum Errei-

  • 7/26/2019 Abschlussbericht Grimm

    9/48

    9

    chen einer akzeptablen Qualitt von 99,99% mindestens vier Korrekturgnge erfor-derlich gewesen. Aus diesen Grnden entschieden wir uns fr einen zweiten,scheinbar aufwendigeren Weg, nmlich die direkte Texterfassung im sogenannten

    Double-Keying-Verfahren. Dabei geben zwei Teams von Datentypisten unabhngigvoneinander den gesamten Wrterbuchtext von Hand in den Computer ein. ZurKontrolle der Eingabe wurde fr einzelne Strecken auch das Triple-Keying-Verfahren angewandt.

    Die Eingabe wurde von einem Erfassungsbro in China durchgefhrt. Auf-grund der bereits im Vorgngerprojekt Mittelhochdeutsche Wrterbcher auf CD-ROM und im Internet gemachten guten Erfahrungen und der gnstigen Konditio-nen erhielt ein weiteres Mal die Eingabefirma TQY Double Key in Nanjing denAuftrag. Fr die Erfassung in China sprachen neben finanziellen Grnden vor al-lem ganz praktische berlegungen: Muttersprachler lesen verstehend und korri-gieren dabei das, was sie als falsche, d. h. von der normierten Standardsprache

    abweichende Schreibung wahrnehmen. Dies ist fr eine zeichengetreue Wiederga-be der vielen historischen Belege im DWB natrlich nicht gewnscht. Es erwiessich daher als Vorteil, da in China Nichtmuttersprachler am Werk waren, die tat-schlich nur das abschrieben, was sie sahen. Ein weiterer Vorteil war, da die chi-nesischen Datentypisten von ihrer eigenen Schrift her gewohnt sind, auf jedes nochso geringe Detail zu achten, weil es eine bedeutungsunterscheidende Funktion ha-

    ben kann. Sie registrieren daher kleinste Abweichungen im Druckbild eines Buch-stabens sehr genau. Das betrifft vor allem die zahlreichen Sonderzeichen in den E-tymologieteilen des DWB mit allen mglichen Akzenten ber und unter den Buch-staben und die Wrter in griechischer Schrift, aber auch durchbrochene, ver-schmierte oder verstmmelte Buchstaben. Die Eingabe erfolgte also uerst zei-chensensibel, und es wurde jedes Diakritikum, das einem muttersprachlichen Erfas-ser unter Umstnden aufgrund des schlechten Drucks oder des gemeinsamen Auf-tretens mit anderen Akzenten entgangen wre, miterfat.

    Die manuelle Eingabe hatte noch einen weiteren groen Vorteil: Alle fr diesptere Datenauszeichnung relevanten und aufgrund der Typographie erkennbarenMerkmale konnten bei der Texterfassung bereits mit eingegeben werden, wodurchder spteren Datenauszeichnung in erheblichem Umfang vorgearbeitet werdenkonnte. In Trier war nach einer eingehenden Datenanalyse eine ausfhrliche An-

    weisung fr die Eingabe des Wrterbuchs in China ausgearbeitet worden, anhandderer alle wesentlichen typographischen Merkmale schon bei der Texterfassungkodiert werden konnten (vgl. Abb. 1).

  • 7/26/2019 Abschlussbericht Grimm

    10/48

    10

    Abb. 1: Anweisungen fr die Eingabe des Wrterbuchs in China

  • 7/26/2019 Abschlussbericht Grimm

    11/48

    11

    Die Vorschriften der Eingabeanweisung betrafen die Wiedergabe der Band-,Spalten- und Zeilenzhlung, die Ersatzkodierungen der in MS WORD nicht dar-stellbaren Zeichen, die Kennzeichnung von Zweifelsfllen, die Markierung derLemmata und anderer ausdrucksseitig erkennbarer lexikographischer Informations-

    positionen.Die Verszitate konnten dadurch, da sie im Druckwrterbuch vom brigen

    Text abgesetzt sind, eindeutig als solche erkannt und bereits bei der Erfassung in ##und ##{ eingeschlossen werden. Auch die den Verszitaten beigefgten Stellenan-gaben, die aus Kapitlchen fr den Autornamen, Kursive fr den Werktitelund/oder Buchstaben-Ziffern-Kombinationen fr die Referenz bestanden und meistvom eigentlichen Zitat abgesetzt waren, konnten erkannt und mit #CC+ bzw. #CCgekennzeichnet werden. Einzge, die bestimmte Gliederungsabschnitte kennzeich-neten, wurden ebenso miterfat und kodiert wie unterschiedlich weite Einrckun-gen bei Verszitaten. Spter konnten diese Merkmale ohne weiteres in SGML-

    Kodierungen umgesetzt werden (vgl. Punkt 3.2).

    Abb. 2: Ausschnitt aus einem Vergleichsprotokoll

  • 7/26/2019 Abschlussbericht Grimm

    12/48

    12

    Die in China mit dem Textverarbeitungsprogramm MS Word fr Windowserfaten Textdaten wurden in Trier nach TUSTEP konvertiert, dem an der Univer-sitt Tbingen speziell fr die Zwecke geisteswissenschaftlicher Forschung entwi-ckelten TUebinger System von TExtverarbeitungsProgrammen(Informationen berTUSTEP unter www.uni-tuebingen.de/zdv/tustep/). Mit Hilfe des TUSTEP-Moduls#VERGLEICHE wurden die beiden Eingabeversionen automatisch miteinanderverglichen. Smtliche Abweichungen der beiden Versionen wurden dabei in einemautomatisch generierten Protokoll festgehalten (vgl. Abb. 2), das anhand des Ver-gleichs mit dem Druckwerk manuell abgearbeitet wurde.

    Das Vergleichsprotokoll enthlt Zeilensynopsen von allen Stellen, an denensich Eingabeversion A und Eingabeversion B voneinander unterscheiden. DieKopfzeile des Vergleichsprotokolls in Abb. 2 gibt Aufschlu ber den Band unddie Spalte innerhalb des Wrterbuchs, mit der der verglichene Textabschnitt be-ginnt; hier wurde ab Spalte 341 im 9. Band des DWB verglichen (die Bandzhlung

    bezieht sich auf die bei dtv erschienene Taschenbuchausgabe in 32 Bnden mit ei-nem Quellenband). Ein Minuszeichen zeigt an, da Version B desselben Textes ander entsprechenden Stelle ein Zeichen weniger enthlt als Version A, ein Pluszei-chen weist darauf hin, da in Version B ein Zeichen mehr enthalten ist als in Versi-on A. Asteriske kennzeichnen Abweichungen beider Versionen voneinander, etwadort, wo die Datentypisten Zweifelsflle markiert haben; {?A} bzw. {?B} war dieverabredete Kennung fr Flle, bei denen man in China auf Probleme stie: ZumTeil waren Zeichen nicht in den vorliegenden Kodierungsanweisungen enthalten dies betraf vor allem Runenzeichen, hebrische und kyrillische Wrter, entlegeneWhrungsangaben oder ungewhnliche Akzentkombinationen , oder die Datenty-

    pisten waren sich generell unsicher, was an den betreffenden Stellen zu lesen war.Diese Flle wie auch die anderen im Protokoll festgehaltenen Abweichungen wur-den in Trier von Hilfskrften und Mitarbeitern im gedruckten Werk nachgeschla-gen und nachbearbeitet. Dabei wurden Eingabefehler korrigiert, fehlende Zeichennachgetragen, Kodierungen fr bestimmte typographisch hervortretende Merkmaleeingegeben und bestimmte Phnomene wie etwa unterschiedlicher Zeileneinzug beigleicher inhaltlicher Funktion vereinheitlicht.

    In einem weiteren Schritt wurden darber hinaus eigens entwickelte Fehler-suchroutinen eingesetzt (vgl. Abb. 3), um Druckfehler und doppelte Eingabefehler

    d. h. Falscheingaben, die von beiden Teams an der gleichen Stelle gemacht wur-den aufzuspren. Die automatische Fehlersuche frderte Eingabefehler, in gre-rem Umfang aber Fehler der Druckausgabe zutage.

  • 7/26/2019 Abschlussbericht Grimm

    13/48

    13

    Abb. 3: Ausschnitt aus einer TUSTEP-Datei mit Fehlersuchroutinen

    Die Kontrollroutinen trugen verschiedenen mglichen Fehlerquellen Rechnung:Durchaus ergebnisreich war das Aufspren von doppelten Eingabefehlern bei be-stimmten Buchstabenkombinationen; es wurden z. B. drei hintereinander vorkom-mende gleiche Zeichen oder auch fr das Neuhochdeutsche eher ungewhnlicheZeichenkombinationen wie yy gesucht (vgl. hierzu und zum folgenden die durchsenkrechte Striche voneinander abgetrennten sogenannten Suchzeichenfolgen inAbb. 3). Dabei war im einzelnen zu prfen, ob ein (Eingabe- oder Druck-)Fehlervorlag oder nicht. Hufig entstanden Fehler auch durch die Falscheingabe von cstatt eaufgrund schlechter Druckqualitt oder die Verwechslung vonfiund Ligatur

    fl. Neben der Korrektur der Eingabefehler und der Bearbeitung der Zweifelsflle,die sich im Durchschnitt auf etwa ein Vorkommen innerhalb einer Spalte beliefen,wurden die im DWB gefundenen Druckfehler in einem Druckfehlerverzeichnis zu-sammengestellt, das in der Zusammenstellung der Korrigenda einem Neudruck desDWB beigegeben werden knnte. Jeder eindeutige Druckfehler wurde fr die elekt-ronische Version korrigiert, doch ist in den Ausgangsdaten noch der ursprnglicheText mit dem Druckfehler erhalten.

  • 7/26/2019 Abschlussbericht Grimm

    14/48

  • 7/26/2019 Abschlussbericht Grimm

    15/48

    15

    meist aus der schlechten Druckqualitt des DWB ergeben haben, fr die die chine-sischen Datentypisten nicht verantwortlich zeichnen. Insgesamt war das Ergebnisder Eingabe uerst zufriedenstellend, so da die durch eine Trierer Initiative ge-grndete Erfassungsfirma auch anderen Projekten und Kooperationspartnern emp-fohlen und mit Erfolg eingesetzt werden konnte.

    Von der korrigierten TUSTEP-Datei ausgehend wurden zum einen Pro-grammroutinen fr die Auszeichnung der Daten mit den internationalen StandardsSGML und TEI entwickelt, zum anderen wurden auf der Basis der korrigiertenEingabedaten mittels einer TUSTEP-Satzroutine PDF-Files hergestellt, die dasWrterbuch so nachbilden, wie es im Druck vorliegt. Die PDF-Files des gesamtenWrterbuchs einschlielich des Quellenverzeichnisses sind fertiggestellt, und einprint on demand ist mglich. Sobald die Sonderzeichen eingebunden sind, kanndas gesamte Wrterbuch auch im PDF-Format mit dem digitalen DWB mitgeliefertwerden.

    Die Sonderzeichendarstellung bereitet allerdings generell noch Probleme,weil Sonderzeichen in verschiedenen Schriftarten und Schriftgren vorkommenknnen, viele dieser Zeichen noch nicht in den Zeichenstzen der elektronischenMedien zur Verfgung stehen und es auch keine standardisierten Abbildungsmg-lichkeiten fr diese Zeichen gibt. Fr die Darstellung von annhernd 1200 Zeichenmuten Lsungen gefunden werden; soweit es mglich war, wurde auf Ersatzdar-stellungen zurckgegriffen, etwa bei den in frheren Sprachstufen hufig vorkom-menden bergestellten Buchstaben. Die seltener auftretenden Sonderzeichen, z. B.Runen, alte Gewichts- und Whrungsbezeichnungen oder musikalische Notenzei-chen, wurden durch Umschreibungen in eckigen Klammern ersetzt. Langfristig isteine Lsung angestrebt, die mglichst umfassend den UNICODE-Standard berck-sichtigt. Dagegen wurde die Einbringung von Zeichenimages, wie sie derzeit nochdas OED verfolgt, aus mehreren Grnden ausgeschlossen: Zunchst ist das Einbin-den von Zeichenimages sehr aufwendig, da diese in allen verwendeten Schriftgr-en vorgehalten werden mssen. Auerdem entstehen dadurch, da mit den Imagesder Textflu unterbrochen wird, grere Probleme bei der Durchfhrung von Such-anfragen und bei der zeilenweisen Darstellung der Wrterbuchartikel am Bild-schirm. Die rasch fortschreitende Entwicklung von UNICODE lt eine zufrieden-stellendere Lsung in absehbarer Zeit erwarten, daher wurden alle Zeichen, die

    derzeit in den digitalen Versionen des DWB noch nicht exakt darstellbar sind, sokodiert, da sie sofort umgesetzt werden knnen, wenn die entsprechenden Fontszur Verfgung stehen.

  • 7/26/2019 Abschlussbericht Grimm

    16/48

  • 7/26/2019 Abschlussbericht Grimm

    17/48

    17

    gonnen, Programmroutinen zu erstellen, die die von der TEI vorgeschlagenen me-tasprachlichen Kodierungen sukzessive in die TUSTEP-Dateien einbrachten.

    Auszeichnung mit Hilfe von TUSTEP

    Besonders vorteilhaft fr die Auszeichnungsarbeit war, da TUSTEP sich durch dieBevorzugung eines konomischen, expliziten Markups bereits einer Kodierung be-dient, die die zu kennzeichnenden Elemente umschliet. Dementsprechend steht#k+ am Beginn, #k am Ende von Text in Kapitlchen oder #/+ am Beginn, #/ amEnde einer kursiv zu setzenden Passage. HTML oder SGML verwenden zur Mar-kierung einzelner Einheiten ebenfalls ffnende und schlieende Tags; die TU-STEP-spezifischen Anfangs- und Endekennungen knnen also in bestimmten Fl-len sofort durch SGML-Tags ersetzt werden, wie etwa bei der Markierung von Au-tornamen im DWB: Aus #k+Falk-Torp#k wurde Falk-Torp.Auerdem waren bereits bei der Erfassung des Wrterbuchtexts bestimmte

    Kodierungen (Anfang und Ende der Verszitate und unterschiedlich weite Einzge)in die Daten eingebracht worden, die nun umgesetzt werden konnten (vgl. Kap. 2).

    Datenkodierung imtopdown-Verfahren

    Wie im Vorgngerprojekt wurde bei der Auszeichnung des DWB ein topdown-Verfahren angewendet, d. h. die obersten Ebenen der Artikelstruktur wurden zuerstmarkiert und von hier aus die weiteren Elemente in Angriff genommen (vgl. zurKodierung der Daten Abb. 5).

    Hauptlemmata, die im Wrterbuch in Versalien gesetzt sind, wurden bereitsin China mit der TUSTEP-Kodierung #F+ und #F markiert und konnten somit so-fort als Lemmata erkannt und in entsprechender Weise mit der SGML-Kodierung LEMMA markiert werden.

    In dem Beispiel in Abb. 5 tritt ein Homographentrenner hinzu, der in einemr end-Attribut enthalten ist. Durch die Kennzeichnung der Lemmata konnten auchdie Artikelanfnge eindeutig bestimmt und die einzelnen Artikel automatisch inund eingeschlossen werden. Die -Tags enthalten wei-

    tere Informationen zu den jeweiligen Artikeln: Zum einen wird die laufende Num-mer des Eintrags zusammen mit der Buchstabenstrecke, in der sich der Artikel be-findet, wiedergegeben: Im Beispiel ist dies im Ausdruck i d=GG25306enthalten,der anzeigt, da es sich um Lemma Nr. 25.306 innerhalb der G-Strecke handelt.Zum anderen gibt das n-Attribut des -Tags Aufschlu ber die Stelle, ander es im Druckwrterbuch zu finden ist, nmlich in Band 9 in Spalte 340 und Zei-le 7.

  • 7/26/2019 Abschlussbericht Grimm

    18/48

    18

    Abb. 5: Artikel 1grimm im TUSTEP-Format mit SGML-Kodierungen

    Die weitere automatische Auszeichnung umfate die grammatischen Angaben, dieeinzelnen Artikelteile mit ihrer jeweiligen hierarchischen Gliederung, Verszitate,Belegstellenangaben zu Verszitaten, Belegstellenangaben zu Prosazitaten undnichtlateinische Buchstaben sowie Ausdrcke und Zitate z. B. in kyrillischer oderhebrischer Schrift.Einige Problemflle bei der Auszeichnung, die sich aufgrund der besonderen Ge-schichte und Erscheinungsform des DWB ergaben, sollen im folgenden beispielhaftgeschildert werden.

    Kodierung der Artikelstruktur

    Besonders schwierig und zeitintensiv war die Kodierung der Artikelstruktur undder entsprechenden einzelnen Gliederungsabschnitte: Die Gliederung eines Wortar-tikels in einem modernen Wrterbuch wrde etwa nach dem Lemma zunchst eineAngabe zur Wortart kombiniert mit Informationen zur Flexion (grammatische An-gaben) enthalten, dann einen Formteil und schlielich den Bedeutungsteil mit Be-

  • 7/26/2019 Abschlussbericht Grimm

    19/48

    19

    legen zum Wortgebrauch. Ein Beispiel fr ein neueres nationalsprachliches Wr-terbuch, das von seinem Umfang und Anspruch her als mit dem DWB vergleichbareingeschtzt werden kann, ist das Oxford English Dictionary(OED). Hier wurden

    jedoch von Beginn an bestimmte Vereinbarungen zur Artikelgestaltung befolgt,und auch bei der Digitalisierung der zweiten Ausgabe war es von groem Vorteil,da es eine weitgehend einheitliche Artikelstruktur gab, an die man die Routinenzur Generierung der Datenkodierung schnell anpassen konnte. Das DWB hingegenweist eine enorme Heterogenitt in der Artikelgestaltung auf, die sich zum einenaus der langen Entstehungszeit des Wrterbuchs, zum anderen aber auch aus derVorliebe einzelner Bearbeiter fr bestimmte Gliederungssysteme ergibt. Im 19.Jahrhundert existierten noch keinerlei Vorgaben fr die Erstellung von Wrterb-chern, so da die Bearbeiter bei der Abfassung ihrer Artikel nach Gutdnken ver-fuhren. Erst in den dreiiger Jahren des 20. Jahrhunderts wurden Anweisungen frdas Verfassen der DWB-Artikel erstellt. Von den Anfngen des DWB mit den

    Brdern Grimm bis zum Ende seiner Ausarbeitung schlugen immer wieder zumTeil gegenlufige Bearbeiterprferenzen durch.

    Um die leichtere Orientierung im Wrterbuch zu ermglichen, wird daher inder elektronischen Fassung ein berblick ber den Aufbau der Artikel in einemgesonderten Fenster angeboten, dessen Inhalte mit dem eigentlichen Wrterbuch-text im benachbarten Fenster verknpft sind (vgl. unter 4.2 und 4.3). Voraussetzungfr die Programmierung dieses Fensters war eine SGML-Kodierung, der entnom-men werden konnte, welche Hierarchiestufe des jeweiligen Artikels gerade erreichtwar, und die zudem Schachtelungen ihrer selbst erlaubte, damit die komplexeStruktur der Artikel korrekt nachgebildet werden konnte. Mit dem -Tag,der solche Schachtelungen erlaubt, konnte diese Kodierung realisiert werden. DieKodierung enthlt also dieInformation, da der folgende Abschnitt mit der Gliederungsmarke B. eingeleitetwird, sich auf der zweiten Hierarchieebene des Artikels befindet und in Band 9 aufSpalte 340 in der 27. Zeile beginnt (vgl. Abb. 6; halbfetter Satz kennzeichnet in denAbbildungen die jeweils relevanten Merkmale).

    Die -Tags wurden in die Daten eingesetzt, indem bestimmte Sche-mata der Artikelgliederung aus den Daten isoliert und den Programmroutinen zu-grundegelegt wurden. Verschiedene Uneinheitlichkeiten muten bercksichtigt

    werden: 1) etwa kann die dritte, zweite oder oberste Gliederungsebene bezeich-nen, je nachdem, ob der Artikel mit I. A. 1), A. 1) a) oder 1) a) beginnt.Auch die Abfolge der Gliederungsmarken variiert: Neben I. A. 1) kommt z. B.auch A. I. 1) vor. Die Programme prften, ob die Gliederung des jeweiligen Arti-kels einem der Schemata entsprach oder nicht. Zum Teil wurde daraufhin derenBandbreite erweitert, zum Teil mute manuell nachgebessert werden, etwa in Fl-len, wo Gliederungsmarken durch Setzerfehler unterschlagen oder wo falsche Glie-derungsmarken gesetzt waren. Bestimmte interne Kodierungen ermglichten dann

  • 7/26/2019 Abschlussbericht Grimm

    20/48

    20

    eine Korrektur der Gliederungsmarken, die in den Routinen bercksichtigt wur-de.

    grimm,

    adj.

    &kursiv;&Spaced;form[...]

    &khgr;&rgr;&egr;&mgr;&igrac;&zgr;&ohgr;[...]

    Fick

    &Super;3&super;3, 142

    [...][...]

    [...]

    mein Tilly kam nicht aus dem hain,er war erhitzt und grimm genug

    Droste-Hlshoff

    2, 158;

    [...]

    Abb. 6: Artikel 1grimm mit hierarchisch angeordneter SGML-Kodierung

  • 7/26/2019 Abschlussbericht Grimm

    21/48

    21

    Die Nachbildung der Hierarchie durch die oben erwhnte Schachtelung der-Tags wurde zum Aufbau des Artikelgliederungsfensters genutzt.

    Unterscheidung der Trenn- und Bindestriche

    Ein weiteres Beispiel fr den Einsatz halbautomatischer Verfahren ist die notwen-dige Unterscheidung der Trenn- und Bindestriche: Da der ursprngliche Zeilenfallder zweispaltig gesetzten Druckausgabe nicht beibehalten wurde, muten zunchstdie Zeilengrenzen beseitigt werden. Auerdem sind Reihungen im DWB nichtdurch Kommata getrennt; statt eines eindeutigen

    ei chel - , grn- ,

    am Zeilenende mute

    ei chel - gr n-

    aufgelst werden. Zur effektiven Lsung dieses Problems wurde ein Programm er-stellt, das die in einer Datei vorkommenden und aufgrund ihrer Umgebung alsproblematisch erkannten Kurzstriche am Zeilenende nacheinander am Bildschirmaufrief und dem Bearbeiter erlaubte, je nach der Funktion dieser Striche unter-schiedliche Kodierungen einzusetzen, die im spteren Programmablauf in bestimm-ter Weise gedeutet wurden. Die Markierung &-stand dabei fr solche Flle, beidenen der Kurzstrich erhalten bleiben, die folgenden Zeichenketten aber sofort andiesen angeschlossen werden sollten. &&-wurde fr solche Flle verwendet, beidenen nach dem Bindestrich ein Leerzeichen stehen sollte. Auf diese Weise war

    z. B. die Unterscheidung von feststehenden Ausdrcken wiedet t es&-- det t es

    und Reihungen in der Form

    ei chel - gr n&&-schel l en- #/ +und#/ - herzdaus

    gewhrleistet; die brigen Kurzstriche konnten aufgelst und der nachfolgendeText direkt mit dem vorhergehenden verbunden werden. Die neu zusammengefg-ten Zeichenfolgen wurden danach in eine gesonderte Datei ausgegeben und noch-

    mals berprft.

    Auszeichnung der Stichwrter in Reihen- oder Nestartikeln

    hnlich aufwendig war die Identifizierung und Auszeichnung der in Reihen- oderNestartikeln angesetzten Stichwrter. Aus Platzgrnden sind Lemmata in Komposi-tareihen innerhalb eines Artikels vielfach so gedruckt, da lediglich die Grundwr-ter gesperrt angegeben werden, whrend fr das Bestimmungswort ein Bindestrich

  • 7/26/2019 Abschlussbericht Grimm

    22/48

  • 7/26/2019 Abschlussbericht Grimm

    23/48

    23

    Die Vollform des Sublemmas wurde in -Tags eingeschlossen und frdie Anzeige der Sublemmata in der Lemmalaufleiste verwendet (vgl. Abb. 11 undAbb. 13). Die Korrekturen der Formen wurden mit Hilfe von Listen durchgefhrt,die die Hilfskrfte mit den jeweiligen Vorkommen im Druckwrterbuch vergli-chen. Die aufgefundenen Sublemmata wurden, hnlich dem Verfahren bei derLemmaauszeichnung, mit Band-, Spalten- und Zeilenangabe versehen. In der aktu-ellen elektronischen Version sind etwa 80% der vorkommenden Sublemmata aus-gezeichnet, fr die restlichen Flle mssen die brig gebliebenen Sperrungen ein-zeln berprft und die ggf. neu hinzukommenden Sublemmata der Lemmaliste hin-zugefgt werden.

    Durch das Einsetzen einer Identifikationsnummer auch fr die Sublemmatakann die Verlinkung der Lemmaverweise im Wrterbuch erfolgen, die bereitsweitgehend vorbereitet wurde: Zunchst wurden diejenigen Zeichenketten gesucht,die als Lemmaverweiszeichen gelten knnten, etwa vgl. oder s.. Natrlich

    muten diese Flle daraufhin berprft werden, ob sich daran tatschlich ein Lem-ma anschlo bzw. ob es sich bei den aufgefundenen Zeichenfolgen wirklich umVerweiseinleitungen handelte. In einem zweiten Schritt wurden die Verweise aus-gezeichnet; das Ergebnis wurde von Hilfskrften nachgeprft bzw. korrigiert, dennvielfach gingen Verweise ins Leere, d. h. fr das Verweiswort gab es keinen Lem-maansatz oder das Verweiswort war durch mehrere andere Wrter von der Ver-weiseinleitung getrennt oder ging dieser gar voraus. Zur Zeit wird an der Auszeich-nung der Lemmata, auf die verwiesen wird, noch gearbeitet, denn hier sollen dieIdentifikationsnummern isoliert und bei den Verweisen mit

    eingesetzt werden.

    Der -Tag wird auch fr die Verlinkung mit dem Quellenverzeichnisgenutzt: Nachdem neben den Belegstellenangaben zu Verszitaten auch diejenigenzu Prosazitaten im Wrterbuch zum grten Teil ausgezeichnet sind, wird nun in-tensiv an der Verknpfung der Belegstellenangaben mit den Eintrgen im Quellen-verzeichnis gearbeitet. Dabei werden die Identifikationsnummern des Quellenver-zeichnisses in die Wrterbuchdaten eingebracht und sollen so umgesetzt werden,da mit dem Anklicken einer Belegstellenangabe im Wrterbuch die jeweils zitier-

    te Quelle im Quellenverzeichnis aufgeschlagen wird. Sowohl die Realisierung derBinnenverweise innerhalb des Wrterbuchs als auch die Verknpfung mit demQuellenverzeichnis werden Bestandteile des fr Sommer 2005 geplanten Updatessein.

    Als eine weitere Auszeichnungskomponente wurden ergnzend zu den imWrterbuch bereits vorgegebenen Artikelpositionen Informationen ber den Autoreines Artikels und die Lieferung, der der Artikel zuzuordnen ist, eingefgt. DieseInformationen waren jeweils in den Wrterbuchbnden und im Quellenband enthal-

  • 7/26/2019 Abschlussbericht Grimm

    24/48

    24

    ten; sie wurden digitalisiert und in einer Tabelle zusammengefat, auf die die Pro-grammroutinen zugreifen.

    3.3 Auszeichnung des Quellenverzeichnisses

    Die Auszeichnung des Quellenverzeichnisses (Band 33 der dtv-Ausgabe) ging inhnlicher Weise vonstatten wie diejenige des Wrterbuchs (vgl. Abb. 8): Auch hiermute die Strecke, der ein Eintrag zugeordnet war, genau benannt und jeder Ein-trag mit einer eindeutigen Identifikationsnummer versehen werden. Ebenfalls wa-ren Spalten- und Zeilennummer mitzukodieren, und die Positionen der einzelnenEintrge muten berdies so markiert werden, da eine Reproduktion des Layoutsund zu einem spteren Zeitpunkt eine Verknpfung mit den Wrterbuchdatenermglicht wurde.

    Abb. 8: Quellenverzeichnis im TUSTEP-Format mit SGML-Kodierungen

    Da die Erstellung des 1971 erschienenen Quellenverzeichnisses sich auf einheitli-che Konventionen sttzte, ging die Auszeichnung relativ rasch vonstatten. Dabeikonzentrierten sich die Arbeiten auf die Kodierung der Nach- und Vornamen der

  • 7/26/2019 Abschlussbericht Grimm

    25/48

    25

    Autoren und bestimmte Namenszustze, die mit -Tags versehen wur-den. Auerdem wurden die Quellentitel und Publikationsorte sowie das jeweiligeErscheinungsjahr ausgezeichnet und Haupt- und Nebeneintrge markiert.

    Schon jetzt knnen Autoren und Quellen mit einer bestimmten Datierung in-nerhalb des Quellenverzeichnisses ber die in der CD-ROM-Version eingebundeneSuchmaske gesucht werden. Zustzlich zu den Informationen, die das Quellenver-zeichnis schon in gedrucktem Zustand liefert, wurden jedoch Eintragungen ge-macht, die das Auffinden von Quellen aus einem festgelegten Zeitraum weiter er-leichtern, indem bei Quellen, zu denen keine Datierung angegeben war, die unge-fhre Entstehungszeit eingefgt wurde. Fr das Update ist eine Zeitleiste vorberei-tet, anhand derer der Benutzer Quellen und Belege aus bestimmten Zeitrumen auf-finden kann.

    4 Die elektronische Publikation

    Die SGML/TEI-konforme Version dient als gemeinsame Basis fr die verschiede-nen Publikationsplattformen. Fr die Bereitstellung im Internet werden die SGML-Daten nach HTML konvertiert, so da sie mit blichen Browsern angezeigt werdenknnen. Es erfolgt zunchst eine typographische Aufbereitung, indem die SGML-Markierungen ber entsprechende Style-Angaben in HTML-Anweisungen umge-setzt werden. Darber hinaus werden die Verweisstrukturen innerhalb des Wrter-

    buchs in Hyperlinks abgebildet, die zu einem spteren Zeitpunkt verfolgt werden

    knnen. In hnlicher Weise werden die Daten fr die CD-ROM-Version aus denSGML-Dokumenten erzeugt. Fr beide Plattformen wird eine Suchmaschine auf-gebaut, die sowohl ber die graphische Oberflche der CD-ROM als auch ber ei-nen Web-Server angesprochen werden kann. Sie erlaubt dem Benutzer einen ge-zielten Zugriff auf den Wrterbuchinhalt: Zustzlich zu einer herkmmlichen Voll-textrecherche werden aufgrund der SGML-Kodierung detaillierte Abfragen einzel-ner Artikelpositionen ermglicht, wie z. B. die Suche nach grammatischen Anga-

    ben, nach Stichwrtern, einzelnen Autoren sowie Ausdrcken aus nicht kursivenTextteilen wie z. B. den Belegzitaten oder kursiven Textteilen wie z. B. den Bedeu-

    tungsangaben.Fr das Benutzerhandbuch und den Umgang mit der elektronischen Publika-tion wurde eine konsistente, durchschaubare und im Hinblick auf ihre Aufgabeleicht verstndliche Terminologie entwickelt (s. unter 4.3 und 4.4 die Termini

    Buchstabenleiste, Stichwortsuchfenster, Lemmalaufleiste, Artikelgliederungsfensterusw.). Einen berblick ber die Termini bietet das Register des Benutzerhand-

    buchs zur CD-ROM.

  • 7/26/2019 Abschlussbericht Grimm

    26/48

    26

    4.1 Datenbanken

    Ausgangsbasis fr den Aufbau der Datenbanken sind die SGML-Daten, deren for-male Korrektheit von einem SGML-Parser kontrolliert wurde. Bei fehlerhaften Ko-dierungen erfolgte ein Korrekturschritt, der anschlieend nochmals validiert wurde.

    Der Einsatz des Parsers gewhrleistet, da der SGML-Datenpool nur SGML-Dokumente enthlt, die korrekt nach den TEI-Richtlinien kodiert sind.

    Der Import der Daten in die Datenbanken fr die Zielplattformen CD-ROMund Internet (vgl. Abb. 9) erfolgt ber mehrere Tool Command Language (Tcl)-Skripte, die auf Basis des Copenhagener SGML Tools(CoST) entwickelt wurden.CoST ist als Tcl-Extension implementiert und arbeitet zusammen mit dem von Ja-mes Clark entwickelten SGML-Parser nsgmls. Es setzt auf der durch den SGML-Parser ausgegebenen Element Structure Information Stream(ESIS)-Kodierung frSGML-Dokumente auf.

    ........d1 d2 d3 dn

    SGML Dokumente

    CoST/Tcl Scripte

    d1

    d2

    d3

    dn

    d1

    d2

    d3

    dn

    w1

    w2

    w3

    wx

    ID TCLCODE ID LEMMA POSWORD

    MetaKit Tabellen

    Abb. 9: Import der Daten in die Datenbanken

    In Abb. 6 (vgl. 3.2) ist ein Artikel des Wrterbuchs den TEI-Richtlinien entspre-chend kodiert dargestellt. Diese Kodierung verdeutlicht durch die explizite Mar-kierung der Artikelteile , da der Artikel auf seiner ersten Stufe in einen Formteil,grammatische Angaben und einen Bedeutungsteil unterteilt ist. Die Artikelteile

  • 7/26/2019 Abschlussbericht Grimm

    27/48

    27

    sind selbst wiederum in weitere Komponenten wie beispielsweise untergeordneteBedeutungsebenen gegliedert.

    Die SGML-Hierarchie des Wrterbuchs wird innerhalb der CoST-Skriptebenutzt, um den betreffenden Elementen Aktionen zuzuordnen. Dazu wird eineCoST-Spezifikation definiert, d. h. ein Proze, der die SGML-Daten zu bestimmtenZwecken konvertiert, etwa zur Erzeugung einer Internet- oder einer CD-ROM-Version. Ein Proze besteht aus einzelnen Ereignissen, die an die SGML-Elementegebunden werden knnen. Dabei kann man unterscheiden, ob die Aktion beim An-treffen eines Anfangstags, eines Endetags oder fr den Inhalt eines Elements ausge-fhrt werden soll.

    Ein Ausschnitt aus dem CoST-Skript zum Import der Wrterbuchartikel istin Abb. 10 gezeigt. Durch dieses Skript werden Tcl-Statements fr ein Tool Kit(Tk)-Textwidget erzeugt (vgl. fett markierte Anweisungen), um den Wrterbuch-text mit Hilfe des Taggingmechanismus der Tk-Textwidgets visuell aufzubereiten

    und eine mglichst originalgetreue Darstellung zu erzielen. Als Ausgabe der CoST-Skripte werden mehrere Datentabellen zur Verwaltung des Wrterbuchinhalts auf-gebaut. Im wesentlichen werden dabei mit Hilfe des Softwarepakets MetaKit Ta-

    bellen zum Zugriff auf die Wrterbuchartikel, die Artikelhierarchie und Wortindi-zes fr die Suchmaschine erstellt und verwaltet. ber die Tcl-Extension Mk4tclwerden die Daten direkt aus den CoST-Skripten in die betreffenden Tabellen im-

    portiert. In den in Abb. 10 gezeigten fett gesetzten und unterstrichenen Anweisun-gen werden die vorberechneten Tcl-Statement-Sequenzen in die zugehrigen Me-taKit-Tabellen eingefgt. ber eindeutige Identifikationsnummern sogenannteIds sind die Informationen zu den Wrterbuchartikeln spter abrufbar. InteraktiveKomponenten (z. B. Hyperlinks zu anderen Wrterbuchartikeln) werden ber ent-sprechende Bindings auf den Widget-Tags definiert.

    Das erste Ereignis der in Abb. 10 gezeigten Spezifikation bezieht sich auf ein-Element. Die Spezifikation beinhaltet eine Aktion fr den Inhalt diesesTags. Dort wird das Attribut ID zu die aktuelle interne Numerierung desWrterbuchartikels abgefragt. Diese ID wird dazu verwendet, eine Marke auf denArtikelanfang in einem Tk-Textwidget zu setzen (mit $wwird das Textwidget an-gesprochen, in dem der Artikel spter angezeigt werden soll). Diese Marke wirdspter genutzt, um den Artikelanfang in den sichtbaren Fensterbereich zu bewegen.

    Eine zentrale Anweisung im gesamten CoST-Skript stellt die Zeile do-Chi l dr en dwb2t cl dar, ber die von einer SGML-Hierarchieebene in die nchst-tiefere abgestiegen wird. In unserem Beispiel wird aus der -Ebene in diedarin geschachtelte -Ebene gewechselt. Fr das Stichwort des Artikels wirddurch die Anweisung {el ement FORM wi t hat t val TYPE l emma} ein Tcl-Statement zur Darstellung des Texts in einem Textwidget erzeugt. Das CoST-Statement besagt, da die dort zugeordneten Anweisungen fr alle SGML-

  • 7/26/2019 Abschlussbericht Grimm

    28/48

  • 7/26/2019 Abschlussbericht Grimm

    29/48

    29

    Anschlu daran der Zugriff auf jeden beliebigen Abschnitt des Wrterbuchs mg-lich ist.

    4.2 Publikation im Internet

    Parallel zur Erstellung der CD-ROM-Version wurde, ebenfalls basierend auf demSGML/TEI-Datenpool, die Bereitstellung des Wrterbuchs auf dem Server und dieEntwicklung der graphischen Web-Oberflche durchgefhrt (vgl. Abb. 11).

    Abb. 11: Oberflche der Internetversion

    Im Aufbau orientiert sich die graphische Web-Oberflche mit ihrer Einteilung indieBuchstabenleiste,dieLemmalaufleistemit dem Stichwortsuchfenster, dasArti-kelfensterund dasArtikelgliederungsfensteran der Oberflche der CD-ROM (vgl.unter 4.3).

    Ebenso wurde die Suchmaske, die voraussichtlich im Herbst 2004 eingesetztwerden wird, analog zur CD-ROM konzipiert. Sie wird in einem zustzlichen Fens-

  • 7/26/2019 Abschlussbericht Grimm

    30/48

    30

    ter prsentiert werden und die grundlegenden Funktionen einer Volltextsuche, diemittels UND-, ODER- oder NICHT-Verknpfung und Nachbarschaftssuche genau-er spezifiziert werden kann, sowie eine Stichwortsuche umfassen.

    Seit Juni 2002 ist das gesamte Wrterbuch ber die Adresse www.DWB.uni-trier.de verfgbar. Diese Testversion wurde fr die Browser Netscape 4.7 und In-ternet Explorer 5.5 optimiert. Die stndige Weiterentwicklung der Browser sowieihre uneinheitliche Untersttzung von JavaScript lassen allerdings eine browseru-nabhngige Darstellung des Wrterbuchs im Internet geboten erscheinen. Deshalbwurde zur Darstellung der aktuellen Internetversion, die seit September 2004 onlineist, ein Content ManagementSystem auf open source-Basis eingesetzt. Das SystemZOPE kann auch fr andere Wrterbcher, die u. U. mit dem DWB verbundenwerden sollen (vgl. unter 8 Perspektiven), leicht angepat werden.

    Bereits nach der Installation der ersten Internetversion waren Zugriffszahlenim Bereich von ca. 10.000 Anfragen pro Tag zu verzeichnen, die nach den Berich-

    ten in berregionalen Zeitungen wie der Frankfurter Allgemeinen Zeitung am29.10.2002 (vgl. unter 7 Presseberichte) auf ca. 50.000 pro Tag anstiegen. Mit Er-scheinen der CD-ROM beim Verlag Zweitausendeins und der damit ebenfalls ver-

    bundenen Werbung fr die Online-Version stiegen die Anfragen an das Wrter-buch auf ber 100.000 (die Spitzenwerte liegen nach der Aufnahme einer Presse-mitteilung ber das Online-DWB durch die dpa am 3.8.2004 bei ber 175.000 An-fragen an einzelnen Tagen, vgl. Abb. 12).

  • 7/26/2019 Abschlussbericht Grimm

    31/48

    31

    Monats-Statistik fr August 2004

    Summe Anfragen 2266883

    Summe Dateien 2114995

    Summe Seiten 299207Summe Besuche 29795

    Summe kb 25257484

    Summe unterschiedlicher Rechner (IP-Adressen) 21148

    Summe unterschiedlicher URLs 1003

    Summe unterschiedlicher Verweise 903

    Summe unterschiedlicher Anwenderprogramme 2001

    . Schnitt Maximum

    Anfragen pro Stunde 3046 14876

    Anfragen pro Tag 73125 175098

    Dateien pro Tag 68225 165864

    Seiten pro Tag 9651 19154

    Besuche pro Tag 961 2154

    kb pro Tag 814758 2099091

    Abb. 12: Zugriffsstatistiken fr den Monat August 2004

    4.3 Publikation auf CD-ROM

    Die graphische Oberflche fr die CD-ROM ist auf der Basis von Tcl/Tk imple-mentiert unter Verwendung der Extensions Tix und BLT. Sie ist von links nachrechts in verschiedene Navigationsbereiche untergliedert (vgl. Abb. 13). ber einBLT-tabset-widget kann zunchst eine Wortstrecke aufgeschlagen werden. EinMausklick auf eine der Indexkarten derBuchstabenleisteam rechten Rand des Be-grungsbildschirms ffnet das elektronische Wrterbuch, das sich dem Nutzer

    folgendermaen prsentiert: In der Lemmalaufleiste im linken Fenster wird eineListe aller Lemmata der ausgewhlten Buchstabenstrecke abgebildet. Die Stich-wortsuche ist mglich ber diese Lemmalaufleiste oder direkt ber das entry-widget fr das Stichwortin der Fuleiste. Auf die in dieses Feld eingegebenen Zei-chen reagiert die Lemmalaufleiste und zeigt die Stichwrter an, die mit der einge-gebenen Zeichenfolge beginnen. Per Mausklick auf das gesuchte Lemma in derLemmalaufleiste wird der gewnschte Artikel im Artikelfenster (rechts neben derLemmalaufleiste) aufgeschlagen. Die Kopfzeile bietet Informationen zur aufge-

  • 7/26/2019 Abschlussbericht Grimm

    32/48

    32

    schlagenen Buchstabenstrecke und zum geladenen Abschnitt (hier GRIMM bisGRIMMBITTER). In der ersten Zeile des Artikelfensters (linke Hlfte des Haupt-

    bereichs) finden sich Angaben zum aufgeschlagenen Lemma: Lemmavarianten,grammatische Angabe, exakte Position im gedruckten Wrterbuch (Band, Spalteund Zeile), auerdem lassen sich das Erscheinungsjahr der gedruckten Lieferungund der Artikelverfasser einblenden.

    Abb. 13: Oberflche der CD-ROM

    Im Artikelfenster selbst wird der Wrterbuchtext unter Beibehaltung aller typogra-phischen Eigenschaften abgebildet. Um bei den Benutzern die Akzeptanz der elekt-ronischen Version des DWB im Vergleich zum Druckwrterbuch zu steigern, ori-entiert sich das Erscheinungsbild stark an der gedruckten Fassung. Es wird nichtnur der ausgewhlte Artikel dargestellt, sondern eine grere Wortstrecke vor-gehalten, so da auch der Artikelkontext mit angezeigt werden kann.

  • 7/26/2019 Abschlussbericht Grimm

    33/48

  • 7/26/2019 Abschlussbericht Grimm

    34/48

    34

    Das Suchergebnis wird in Form eines KWIC (Keyword in Context)-Index un-terhalb der Eingabefelder angezeigt und gibt auch Aufschlu ber die Vorkom-menshufigkeit der Suchzeichenfolge. Es kann alphabetisch von A bis Z oder Z bisA, oder aber chronologisch von der ersten bis zur letzten oder der letzten bis zurersten Lieferung sortiert werden. Die Mglichkeit der kombinierbaren Suchanfra-gen lt komplexe Recherchen zu, die im gedruckten Wrterbuch nicht durchfhr-

    bar sind: Ein Nutzer, der sich fr das Thema Wortbildung bei Goethe interessiert,kann z. B. eine kombinierte Suchanfrage formulieren, die alle Adverbien mit demDerivativsuffix -lich, zu denen das DWB einen Goethe-Beleg beinhaltet, ausgibt.Hierzu gibt er im Eingabefeld Stichwortdie Zeichenfolge *lich ein, im Eingabe-feld Wortart adv und im Eingabefeld SiglenG*the (der Asterisk steht fr keinoder beliebig viele Zeichen und bercksichtigt die verschiedenen Schreibungen desAutornamens Goethe) und verbindet diese Elemente ber die UND-Bedingung(Checkboxen am rechten Rand der Eingabefelder).

    Mit einem Klick auf einen Treffer der Ergebnisliste im Suchfenster lt sichdie entsprechende Stelle im Artikelfenster aufschlagen (vgl. Abb. 14). Die Suchzei-chenfolgen sind dort farbig unterlegt. ber die Pfeiltasten am rechten unteren Randdes Artikelfensters kann zum nchsten oder vorhergehenden Treffer der Ergebnis-liste vor- bzw. zurckgeblttert werden. Auch das Quellenverzeichnis des DWB istin die Suchmglichkeiten mit eingebunden; die Verlinkung der darin enthaltenenEintrge mit dem Wrterbuchtext wird zur Zeit erprobt.

    5 Publikationen und ffentlichkeitsarbeitDie Prsentationen und Publikationen des Projekts gingen zum einen aus einer re-gen Tagungs- und Konferenzteilnahme hervor, die sich sowohl im nationalen alsauch im internationalen Rahmen bewegte, zum anderen verdanken sie sich demgroen Interesse der ffentlichen Medien, die immer wieder in Presseartikeln, aberauch in Rundfunk- und Fernsehbeitrgen ber die Digitalisierung des DWB berich-teten (vgl. unter 7).

    Ein berblick ber die Prsentationen und Publikationen der Projektmitar-

    beiterinnen und -mitarbeiter sowie ein kurzer Bericht ber das in der letzten Fr-derphase in der Akademie der Wissenschaften und der Literatur Mainz durchge-fhrte und die Projektarbeiten bilanzierende Kolloquium sollen im folgenden dieffentlichkeitsarbeit des Projekts dokumentieren.

    5.1 Projektprsentationen

    Die Entwicklung des Projekts wurde von Beginn an sowohl im In- als auch imAusland mit regem Interesse verfolgt. Durch das Vorgngerprojekt, den Mittel-

  • 7/26/2019 Abschlussbericht Grimm

    35/48

    35

    hochdeutschen Wrterbuchverbund, waren bereits zahlreiche Kontakte zu nationa-len und internationalen Forschergruppen, etwa zur TEI oder zu den Digitalisie-rungszentren in Mnchen und Gttingen geknpft worden, die genutzt werdenkonnten, um zum einen Rckmeldung zur Internetversion und dem Prototyp derCD-ROM-Version zu erhalten und zum anderen Verbindungen zu anderen Digitali-sierungsprojekten herzustellen mit dem Ziel, Informationen und Knowhow auszu-tauschen.

    Besonders intensiv waren die Beziehungen zu den Institutionen, die sich mitder Weiterentwicklung des Standards SGML/TEI beschftigten: So wurde das Pro-

    jekt insgesamt dreimal zu Prsentationen im Rahmen der Gemeinsamen Internatio-nalen Jahrestagung derAssociation for Literary and Linguistic Computingund der

    Association for Computers and the Humanities in Glasgow (2000), Tbingen(2002) und Athens (Georgia/USA) (2003) eingeladen. Mit der Anwendung derTEI-Guidelines bei der Digitalisierung des DWB befate sich ein Vortrag anllich

    des TEI Members Meetingin Nancy (2003).Im Rahmen eher informatischer Veranstaltungen beteiligte sich das Projekt

    an einer Tcl/Tk-Konferenz in Vancouver/Kanada (2002). Im Rahmen eines Kollo-quiums wurde es am Zentrum fr Informatik der Universitt Halle (2004) vorge-stellt.

    Gelegenheiten zur Dokumentation der Projektfortschritte ergaben sich aufnationalem Gebiet zunchst im Rahmen des 4. gemeinsamen Kolloquiums der Di-gitalisierungszentren Mnchen und Gttingen Forum Retrodigitalisierung im

    November 2000. Hier konnte bereits ein erster Prototyp der CD-ROM-Version desDWB vorgefhrt werden.

    Mit der Verwendung von TUSTEP bei der Realisierung der elektronischenVersion des DWB im Projekt gingen seitens der Tbinger Forschergruppe Bem-hungen einher, TUSTEP durch neuere Programmodule im Hinblick auf automati-sches Tagging weiterzuentwickeln. Gerade das DWB mit seinem groen Umfangund der Heterogenitt der Typographie und Struktur stellte an die TUSTEP-Moduleund deren Stabilitt und Flexibilitt besondere Anforderungen; mit der Teilnahmean den TUSTEP-Workshops in Tbingen und Blaubeuren etwa zum ThemaKommandomakros und interaktive Benutzeroberflchen, Praxis der SGML-konformen Textauszeichnung nach den Richtlinien der TEI oder WWW CGI

    TUSTEP konnten Probleme beim Einsatz des Softwarepakets besprochen und An-regungen an die fr die Weiterentwicklung Verantwortlichen herangetragen wer-den, die direkt in die Programmierung der Module einflossen. Dabei begegnete dieTbinger Entwicklergruppe den Wnschen der Trierer Projektmitarbeiter whrenddes gesamten Projektverlaufs stets mit groer Offenheit und Kooperationsbereit-schaft. Insbesondere die Jahrestagungen der International TUSTEP User Group, beidenen das Projekt 1999 und 2003 in Burgos vorgestellt wurde, waren fr die Pro-

    jektarbeit frderlich.

  • 7/26/2019 Abschlussbericht Grimm

    36/48

    36

    Auch bei strker philologisch ausgerichteten Veranstaltungen konnte sich dasTeam stets mit groem Erfolg und Gewinn beteiligen, so etwa auf der Tagung E-dition und bersetzung der Arbeitsgemeinschaft fr Germanistische Edition 2000in Osnabrck, auf der 3. Arbeitstagung deutschsprachiger Akademiewrterbcher2000 in Zrich, im Rahmen des Deutschen Germanistentags 2001 in Erlangen, aufder Internationalen intradisziplinren Tagung zur Lexikographie in der Berlin-Brandenburgischen Akademie der Wissenschaften 2002 in Berlin und auf dem 4.Arbeitstreffen deutschsprachiger Akademiewrterbcher 2003 in Gttingen.

    Der Hhepunkt der bisherigen Projektvorstellungen war zweifellos die Pr-sentation der CD-ROM-Publikation im Rahmen der Feiern anllich des150jhrigen Jubilums des DWB im Juli 2004 in Berlin.

    Die Wichtigkeit des direkten Austauschs mit hnlich gelagerten Projektenund die Mglichkeit der gegenseitigen Information ber angewandte Standards und

    jngste Entwicklungen auf dem Gebiet der plattformunabhngigen Digitalisierung

    kann nicht genug betont werden, und es bleibt fr die Zukunft zu wnschen, dader beschrittene Weg der Orientierung an internationalen Standards auch innerhalbDeutschlands weiter fortgesetzt wird.

    5.2 Publikationen

    Publikationen, die sich mit dem Projektvorhaben beschftigen, wurden in Fachzeit-schriften, in Universitts- und Akademiejournale und in Tagungsbnde aufgenom-men. Dazu trugen zum einen die oben bereits dokumentierten Konferenz- und Ta-gungsteilnahmen der Mitglieder des Projektteams bei, zum anderen aber auch kon-krete Anfragen durch die Herausgeber einschlgiger Zeitschriften.

    Die Publikationsttigkeit des Projektleiters und der Projektmitarbeiterinnenund -mitarbeiter soll durch die folgende Zusammenstellung auszugsweise doku-mentiert werden, dabei sind die bibliographischen Angaben zur Online- und Offli-ne-Version des DWB vorangestellt:

    Deutsches Wrterbuch von Jacob und Wilhelm Grimm im Internet, entwickelt im FachGermanistik der Universitt Trier in Zusammenarbeit mit dem Kompetenzzentrum fr e-lektronische Erschlieungs- und Publikationsverfahren in den Geisteswissenschaften, be-arbeitet von Hans-Werner Bartz, Thomas Burch, Ruth Christmann, Kurt Grtner, Vera

    Hildenbrandt, Thomas Schares, Klaudia Wegge. Gefrdert durch die DFG im Rahmendes Programms Retrospektive Digitalisierung von Bibliotheksbestnden 2002.www.DWB.uni-trier.de.

    Der Digitale Grimm. Deutsches Wrterbuch von Jacob und Wilhelm Grimm. Elektroni-sche Ausgabe der Erstbearbeitung, bearbeitet von Hans-Werner Bartz, Thomas Burch,Ruth Christmann, Kurt Grtner, Vera Hildenbrandt, Thomas Schares, Klaudia Wegge.

  • 7/26/2019 Abschlussbericht Grimm

    37/48

    37

    Herausgegeben vom Kompetenzzentrum fr elektronische Erschlieungs- und Publikati-onsverfahren in den Geisteswissenschaften an der Universitt Trier in Verbindung mit derBerlin-Brandenburgischen Akademie der Wissenschaften.2 CD-ROMs, Benutzerhandbuch, Begleitbuch. 1. Auflage, Juli 2004. Frankfurt am Main:Zweitausendeins 2004.

    [Benutzerhandbuch von Vera Hildenbrandt und Tanja Wagner; 44 S.Begleitbuch mit einer Einleitung von Kurt Grtner und Beitrgen von Hartmut Schmidt:Das Deutsche Wrterbuch. Gebrauchsanleitung; Ecke Bonk: random walk/random rea-ding; Hans-Werner Bartz, Thomas Burch, Ruth Christmann, Kurt Grtner, Vera Hilden-brandt, Thomas Schares, Klaudia Wegge: Wie das Deutsche Wrterbuch in den Computerkam; Martin Weinmann: Grimm-Bilderbogen; Wilhelm Grimm: Bericht ber das Deut-sche Wrterbuch; Jacob Grimm: ber das pedantische in der deutschen sprache; 131 S.]

    Bartz, Hans-Werner/Christmann, Ruth/Hildenbrandt, Vera/Schares, Thomas: Beyond theScope of the Printed Dictionary. Digitizing the Deutsche Wrterbuch by Jacob andWilhelm Grimm. In: Standards und Methoden der Volltextdigitalisierung. Beitrge des In-ternationalen Kolloquiums an der Universitt Trier, 8./9. Oktober 2001. Hg. v. Thomas

    Burch, Johannes Fournier, Kurt Grtner und Andrea Rapp (Akademie der Wissenschaftenund der Literatur Mainz. Abhandlungen der Geistes- und Sozialwissenschaftlichen Klas-se; Einzelverffentlichung Nr. 9). Stuttgart 2003, S. 291-295.

    Bartz, Hans-Werner/Hildenbrandt, Vera: Das Deutsche Wrterbuch von Jacob Grimmund Wilhelm Grimm auf CD-ROM und im Internet. In: Wissenschaftliche Lexikographieim deutschsprachigen Raum. Beitrge zur Internationalen intradisziplinren Tagung zurLexikographie in der Berlin-Brandenburgischen Akademie der Wissenschaften, 13.-16.Oktober 2002. Hg. v. Thomas Stdtler. Heidelberg 2003, S. 445-449.

    Burch, Thomas/Christmann, Ruth/Hildenbrandt, Vera/Schares, Thomas : Ein Hausbuchfr alle? Das Deutsche Wrterbuch von Jacob und Wilhelm Grimm auf CD-ROM und

    im Internet.In: Jahrbuch fr Computerphilologie 2, Paderborn 2000, S. 11-34. Auerdemin: Jahrbuch fr Computerphilologie online:http://computerphilologie.uni-muenchen.de/jg00/christma/christma.html.

    Burch, Thomas/Grtner, Kurt: Arbeiten des Kompetenzzentrums fr elektronischeErschlieungs- und Publikationsverfahren in den Geisteswissenschaften an der UniversittTrier. In: Akademie der Wissenschaften und der Literatur Mainz. Jahrbuch 2000. Jahr-gang 51. Stuttgart 2001, S. 253-261, hier S. 255-257.

    Burch, Thomas/Grtner, Kurt/Schares, Thomas: Das digitale Deutsche Wrterbuch derBrder Grimm. In: www.germanistik2001.de. Vortrge und Referate des Erlanger Ger-manistentages 2001. In Zusammenarbeit mit Petra Boden u.a. hg. v. Hartmut Kugler. Bie-lefeld 2003, Bd. 2, S. 713-728.

    Burch, Thomas/Grtner, Kurt/Fournier, Johannes: Arbeiten des Kompetenzzentrums frelektronische Erschlieungs- und Publikationsverfahren in den Geisteswissenschaften ander Universitt Trier. In: Akademie der Wissenschaften und der Literatur Mainz. Jahrbuch2001. Jahrgang 52. Stuttgart 2002, S. 251-264, hier S. 252-254.

    Burch, Thomas: Tcl/Tk-Based Electronic Publication of the Deutsche Wrterbuch. In: 9thAnnual Tcl-Conference 2002 in Vancouver/Canada. Proceedings electronically availableon CD-ROM, edited by Jeff Hobbs and Kevin Kenny. Online unter:

  • 7/26/2019 Abschlussbericht Grimm

    38/48

    38

    http://aspn.activestate.com/ASPN/Tcl/TclConferencePapers2002/Tcl2002papers/burch-epub/dwbtcltk.doc.

    Burch, Thomas/Hildenbrandt, Vera: Random Reading im Book of Words. Das an derUniversitt Trier digitalisierte Deutsche Wrterbuch auf der Documenta11. In: Unijour-nal. Zeitschrift der Universitt Trier 28/2002, S. 25f.

    Burch, Thomas/Grtner, Kurt/Fournier, Johannes: Arbeiten des Kompetenzzentrums frelektronische Erschlieungs- und Publikationsverfahren in den Geisteswissenschaften ander Universitt Trier. In: Akademie der Wissenschaften und der Literatur Mainz. Jahrbuch2002. Jahrgang 53. Stuttgart 2003, S. 258-268, hier S. 258-261.

    Burch, Thomas/Grtner, Kurt/Hildenbrandt, Vera: Das digitaleDeutsche WrterbuchderBrder Grimm: vom Buchformat zur elektronischen Publikation. In: Bibliothek und Wis-senschaft 36 (2003), S. 163-177.

    Christmann, Ruth/Hildenbrandt, Vera/Schares, Thomas: Ein heiligthum der sprachedigitalisiert: Das Deutsche Wrterbuch von Jacob und Wilhelm Grimm auf CD-ROM undim Internet. In: Nicols Castrillo Benito/Peter Stahl (Hg.): TUSTEP educa. Actas de Con-

    greso del International TUSTEP User Group. Pearanda de Duero (Burgos) Octubre 1999.Burgos 2001, S. 13-37.

    Christmann, Ruth: Books into Bytes: Jacob and Wilhelm Grimm's Deutsches Wrterbuchon CD-ROM and on the Internet. In: Literary and Linguistic Computing 16 (2001),S. 121-133.

    Christmann, Ruth/Schares, Thomas: Towards the User: The digital Edition of theDeutsche Wrterbuch by J. and W. Grimm. In: Literary and Linguistic Computing 18(2003), S. 11-22.

    Das digitale Deutsche Wrterbuch der Brder Grimm: ein Hausbuch fr alle. Akten desKolloquiums vom 15. und 16. Mai 2003 in Mainz. Hg. v. Thomas Burch, Kurt Grtnerund Vera Hildenbrandt. (Akademie der Wissenschaften und der Literatur Mainz: Abhand-lungen der Geistes- und sozialwissenschaftlichen Klasse). Stuttgart 2004 [in Vorberei-tung].

    Falterbaum, Beate/Hildenbrandt, Vera: Das digitale Deutsche Wrterbuch der BrderGrimm: ein Hausbuch fr alle. Bericht zum Kolloquium am 15. und 16. Mai 2003. In:Unijournal. Zeitschrift der Universitt Trier 29/3 (2003), S. 33f.

    Falterbaum, Beate/Hildenbrandt, Vera: Das digitale Deutsche Wrterbuch der BrderGrimm: ein Hausbuch fr alle. Bericht ber das Kolloquium an der Akademie der Wis-senschaften und der Literatur Mainz am 15./16. Mai 2003. In: Lexicographica. Internatio-nales Jahrbuch fr Lexicographie 19 (2003), S. 320-322.

    Grtner, Kurt/Wolz, Ralf: Aus der Arbeitsgemeinschaft Elektronisches Publizieren. In:Akademie-Journal. Magazin der Union der deutschen Akademien der Wissenschaften1/2004, S. 67/68.

    Hildenbrandt, Vera/Schares, Thomas: Das Grimmsche Wrterbuch geht ins 21. Jahrhun-dert: Prsentation eines Prototyps des digitalen Deutschen Wrterbuchs von Jacob undWilhelm Grimm.Vortrag im Rahmen des 4. Gemeinsamen Kolloquiums Forum Retrodi-gitalisierung am 28./29. November 2000 in Mnchen.Online unter: www.bsb-muenchen.de/mdz/forum/hildenbrandt/index.htm.

  • 7/26/2019 Abschlussbericht Grimm

    39/48

    39

    Hildenbrandt, Vera: Ecke Bonk zeigt deutsche Worte: 100 Tage, im 28 Sekundentakt. In:FAZ.NET 1.7.2002.

    Kersting, Ruth/Rapp, Andrea: Mein schnes Frulein ... Bedeutungs- und Bezeichnungs-wandel in Wortfeldern anhand des Grimmschen Wrterbuchs. In: Praxis Deutsch 165(2001), S. 54-59.

    Der folgende Bericht ber das Projekt geht fast ausschlielich auf die einschlgigen Pub-likationen der Projektmitarbeiter zurck:

    Mreschar, Renate I.: Der elektronische Grimm. Das Deutsche Wrterbuch wird digitali-siert. In: Einblicke. Geistes- und Sozialwissenschaften in der DFG. Hg. v. Jutta Rateike(Deutsche Forschungsgemeinschaft). Bonn 2003, S. 63-73.

    5.3 Kolloquium in der Akademie der Wissenschaften und der LiteraturMainz am 15./16. Mai 2003

    Das Kolloquium zum Thema Das digitale Deutsche Wrterbuch der BrderGrimm: ein Hausbuch fr alle, das am 15. und 16. Mai 2003 in der Akademieder Wissenschaften und der Literatur Mainz stattfand und von der DFG in groz-giger Weise gefrdert wurde, trug in besonderem Mae zu einem guten Projekt-abschlu bei. Hier wurden Offline- und Online-Version vorgefhrt und verschiede-ne Aspekte der Projektarbeit vorgestellt, die von namhaften Fachwissenschaftlerin-nen und Fachwissenschaftlern aus Retrodigitalisierungs- und Wrterbuchprojektenund Vertretern aus Bibliotheken und Verlagen aus Deutschland, den Niederlanden,der Schweiz und Grobritannien mit Statements begleitet wurden.

    Einen Hhepunkt des Kolloquiums stellte der Abendvortrag Edmund Wei-ners dar, der Einblick in die Arbeit am digitalen Oxford English Dictionary ge-whrte. Die Gelegenheit, die eigene Arbeit im internationalen Vergleich zu sehen,war uerst gewinnbringend fr das Projektteam, wie berhaupt der Austausch dereinzelnen Projekte von den Besuchern gern angenommen und die Demonstrationenverschiedener anderer Projekte aus Trier sehr begrt wurden.

    Die Veranstaltung demonstrierte beispielhaft, wie aus der Zusammenarbeitvon Philologie und Informatik und durch die Kooperation von Universitten, Bib-liotheken und Akademien neue Mglichkeiten fr den Einsatz internationaler Stan-

    dards und innovativer Technologien zur weiteren Erforschung, aber auch zur Erhal-tung und umfassenden Nutzung geisteswissenschaftlicher Grundlagenwerke ge-schaffen werden knnen.

    Ein Tagungsband, der die einzelnen Beitrge und Statements versammelnwird, ist in Vorbereitung und soll noch im Verlauf des Jahres 2004 in den Ab-handlungen der Geistes- und sozialwissenschaftlichen Klasse der Akademie derWissenschaften und der Literatur Mainz erscheinen.

  • 7/26/2019 Abschlussbericht Grimm

    40/48

    40

    6 Der digitale Grimm auf derDocumenta11in Kassel,

    8. Juni bis 15. September 2002Von besonderer Bedeutung fr das Projekt war die Zusammenarbeit mit demKnstler und Typosophen Ecke Bonk, der sich mit einem Exponat zum DWB ander Documenta11beteiligte. Von Juni bis September 2002 war in Kassel eine inzwei Rumen untergebrachte Installation zu besichtigen, die die Entwicklung desDWB und seine noch nicht vollendete Geschichte demonstrierte. In einem erstenRaum waren die 380 Lieferungen der Erstbearbeitung des DWB in der chronologi-schen Reihenfolge ihres Erscheinens ausgestellt. Zustzlich waren die 47 bereitserschienenen Lieferungen der Neubearbeitung mit in die Ausstellung hineinge-

    nommen. Als logische Ergnzung bot sich schlielich die Aufnahme der weiterenEntwicklung des DWB in seiner digitalisierten Form an: Durch verschiedene Pro-jektionen der digitalen Version wurden dem Besucher jeweils andere Ansichten desWrterbuchs prsentiert.

    Im Durchgang aus dem ersten in den zweiten Raum der Installation, gleich-sam den bergang des gedruckten DWB zu einem neuen, digitalen Zeitalter veran-schaulichend, wurde im Verlauf der 100 Ausstellungstage jedes einzelne Stichwortin einer vom Eintrag A bis zu Zypressenzweig durchlaufenden Endlosen Lis-te angezeigt. In einem zweiten Raum wurden dann die Wrterbuchartikel selbstauf drei Wnde projiziert; dafr wurden die Artikel per Zufallsgenerator aus demgesamten Datenbestand des DWB ausgewhlt. Nach einer gewissen Zeit, die jenach Artikellnge variierte, wurden wiederum durch den Zufallsgenerator ausge-whlt drei neue Artikel prsentiert, so da der Besucher sich mit immer neuenund unerwarteten Wrtern konfrontiert sah. Nach den Vorstellungen und Ideen vonEcke Bonk wurde die fr das Exponat bentigte Software in Trier entwickelt undzusammen mit den Daten des digitalen Grimm zur Verfgung gestellt.

    Fr die Projektmitarbeiterinnen und -mitarbeiter bot die Installation Bonkszum einen eine willkommene Gelegenheit, ihre Arbeit einem groen Publikum zu

    prsentieren, zum anderen war die Begeisterung, mit der das Projekt Bonks aufge-

    nommen wurde, Ansporn fr die weiteren Projektarbeiten. Der Erfolg der Zusam-menarbeit mit Ecke Bonk zeigte sich auch darin, da die Stadt Kassel im Septem-ber 2003 eine weitere Ausstellung der Arbeit Ecke Bonks und des Trierer Projektsunter dem Titel Random Reading 2 durchfhrte und sich um eine dauerhafte In-stallation desDocumenta-Exponats bemht.

    Neben der ffentlichkeitswirkung fr das Projekt hatte die Zusammenarbeitmit Ecke Bonk aber auch direkten Einflu auf das Erscheinungsbild des DigitalenGrimm: In der CD-ROM-Version findet sich unter dem Menpunkt Extras die

  • 7/26/2019 Abschlussbericht Grimm

    41/48

    41

    von derDocumenta11inspirierte ZusatzfunktionRandom Reading: Klickt man die-se an, so wird per Zufallsgenerator ein beliebiges Stichwort aus dem digitalenGrimm ausgewhlt, dessen Bedeutung man weiter nachgehen kann. Auf der CDwird auerdem die in der Documenta11-Prsentation enthaltene Endlose Listealler Stichwrter des digitalen Grimm als Bildschirmschoner zum Herunterladenangeboten.

    7 Berichte in Presse, Internet, Rundfunk und Fernsehen

    Die Presse reagierte mit kleineren und greren Beitrgen auf die Entwicklung derelektronischen Version des DWB. Durch die Zusammenarbeit mit dem KnstlerEcke Bonk im Rahmen derDocumenta11wurde das Projekt zunchst einem gre-

    ren Publikum bekannt (vgl. unter 6). Mit der Publikation der Internetversion desDWB wuchs das Interesse an dem Digitalisierungsprojekt, das sich mit dem Er-scheinen der Beta-Version noch weiter verstrkte. Das Erscheinen der vorlufigenund nun der endgltigen Version der CD-ROM-Fassung wurde ausfhrlich in denverschiedensten Organen besprochen.

    Durch die ausfhrliche Berichterstattung ber die Digitalisierung des DWBwurde nicht nur die Voraussetzung fr einen immer hheren Bekanntheitsgrad desdigitalen DWB selbst geschaffen, sondern auch die Vermittlung der wissenschaftli-chen Inhalte und ihre Kommunikation in die ffentlichkeit aktiv betrieben. Da dieDigitalisierung und damit die breite Verfgbarkeit des DWB von groem Interesse

    fr alle Teile der Gesellschaft ist, zeigt sich in der Vielfalt der Organe, in denenber das DWB berichtet wurde und von denen hier eine Auswahl gegeben wird:

    a) Zeitungs- und Zeitschriftenartikel, Internetbeitrge:

    Bocksrocker, Simone/Lenz, Daniel/Uebelhde, Rainer: Die Wort-Welt ist rund oder docheine Scheibe? In: buchreport.magazin, Februar 2004, S. 86f.

    China machts mglich. LEXIKON: Deutschland erhlt digitales Grimm-Wrterbuch. In:Mannheimer Morgen, 3. August 2004, S. 28.

    China sei Dank: Deutschland erhlt digitales Grimm-Wrterbuch. In: dpa KORR-

    Inland/Literatur/Sprache/Online/, August 2004. China sei Dank: Grimm-Wrterbuch auch digital verfgbar. Chinesische Gymnasiasten tipp-

    ten das Deutsche Wrterbuch in den Computer. In: Der Standard, 10. August 2004.http://derstandard.at/?url=/?id=1746728.

    Chinesische Schler tippten Grimms Wrterbuch ab. In: Braunschweiger Zeitung, 3. August2004, S. 24.

    Der 600-Millionen-Zeichen-Deal. Was die Uni Trier in China mit den Gebrdern Grimmtreibt. In: Saarbrcker Zeitung, 3. August 2004, S. C5.

  • 7/26/2019 Abschlussbericht Grimm

    42/48

    42

    Deutschland erhlt digitales Grimm-Wrterbuch.http://portale.web.de/Internet/?msg_id=5226937.

    Deutschland erhlt digitales Grimm-Wrterbuch. Grundlagenwerk der deutschen Sprache inChina in Computer eingegeben.www.auswaertiges-amt.de/www/de/willkommen/deutschlandinfo/nachrichten_dtl/

    nachrichten_archiv_html?wb=2 (4. August 2004). Dirksen, Jens: Der Grimm fr alle. Das Wrterbuch der Mrchenbrder liegt jetzt im Internet

    und auf CD-Rom vor. In: Neue Ruhr Zeitung, 14. August 2004.

    Dornrschen. In: Die Zeit, Nr. 33, 5. August 2004, S. 38.

    300 Millionen gedruckter Zeichen in den Computer eingegeben. China sei Dank: Deutschlanderhlt das Wrterbuch der Gebrder Grimm digitalisiert als Kauf-CD. In: Gttinger Tageblatt,3. August 2004, S. 15.

    300 Millionen Zeichen in China abgetippt. Grimmsches Wrterbuch in digitaler Form. In:Wiesbadener Kurier, 7. August 2004, S. 14.

    Edinger, Jutta: Digitaler Grimm erscheint. DFG-Projekt der historischen Sprachwissen-schaft. In: Trierischer Volksfreund, Nr. 129, 4. Juni 2004, S. 11.

    Fleiarbeit in Fernost. Das Grimmsche Wrterbuch auf zwei CD-ROMs.www.hr-online.de/website/rubriken/kultur/index.jsp?rubrik=5982&key=standard_document_1822090.

    Geisel, Sieglinde: Im Wortgestber der Jahrhunderte. Das Grimmsche Wrterbuch wirdhundertfnfzig Jahre alt. In: Neue Zrcher Zeitung, Nr. 143, 23. Juni 2004, S. 35.

    GI Paris: Le dictionnaire de la langue allemande des frres Grimm - en ligne. L'immense dic-tionnaire des frres Jacob und Wilhelm Grimm accessible en ligne et bientt sur CD-ROM.In: FplusD. Das deutsch-franzsische Sprachenportal.www.fplusd.de/main/homepage/bereich/rubrik/artikel/index_html?mpId=62&article_id=360&mySelected=2.

    Giersberg, Dagmar: Das Deutsche Wrterbuch der Brder Grimm wird digitalisiert. Beitragfr das Internetportal Kultur und Gesellschaft des Goethe-Instituts.www.goethe.de/kug/mui/int/thm/de60015.htm (Oktober 2003).

    Grimm digital. Grotat: Das Deutsche Wrterbuch als CD-ROM. In: Frankfurter AllgemeineZeitung, Nr. 159, 12. Juli 2004, S. 30.

    Grimm digital. In: Mitteldeutsche Zeitung, 24. Juli 2004, S. 26.

    Grimm digital. Wrterbuch made in China. In: Badische Zeitung, 3. August 2004, S. 18.

    Grimms Deutsches Wrterbuch auf 2 CD-ROMs. Das allerwichtigste Buch in deutscherSprache endlich in elektronischer Version der Digitale Grimm. In: Languagelab.at.www.katzenmusik.com/index.php?id=36&backPID=36&swords=digitale&tt_news=155 (29.Juli 2004).

    Grimm-Werk aus Nanjing. In: Aachener Zeitung, 3. August 2004, S. 19.

    Grimm-Wrterbuch als deutsch-chinesisches Joint Venture. www.mediaculture-online.de/Details.305+M555ea2db7d8.0.html.

  • 7/26/2019 Abschlussbericht Grimm

    43/48

    43

    Grimm-Wrterbuch auf Silberscheiben. In: Freie Presse, 30. Juli 2004.

    Heine, Matthias: Bldel Glimm. In: Die Welt, 3. August 2004, S. 27.

    Heine, Matthias: Wie die Bldel Glimm an uns vorbeigingen. In: Berliner Morgenpost, 4.August 2004. http://morgenpost.berlin1.de/archiv2004/040804/feuilleton/story694980.html.

    Hbl, Michael: Deutsch made in China. Das Grimmsche Wrterbuch ist jetzt digitalisiert. In:Badische Neueste Nachrichten, 11. August 2004.

    Kroener, Wolfgang: Jetzt dozieren die Grimms digital. Das 32 Bnde umfassende Wrter-buch auf CD-ROM Trierer Wissenschaftler erarbeiteten die elektronische Fassung. In:Rheinzeitung, Nr. 188, 14./15. August 2004, S. 108.

    Lingnau, Fee Isabelle: Warum Chinesen besser abtippen. Sprachschatz. Das Deutsche Wr-terbuch der Brder Grimm gibt es jetzt auf CD-ROM, eingetippt in Nanjing. In: HamburgerAbendblatt, 16. Juli 2004.

    Link, Susanne: Das wichtigste Buch in deutscher Sprache. Die digitalen Brder Grimm. In:Frankenpost, 7. August 2004, S. 20.

    Maier, Thomas (dpa): China sei Dank. Deutschland bekommt digitales Grimm-Wrterbuch.In: Schsische Zeitung, 3. August 2004, S. 11.

    Maier, Thomas (dpa): China sei Dank: Deutschland erhlt digitales Grimm Wrterbuch. In:dpa Landesdienst Hessen, 2. August 2004.

    Maier, Thomas (dpa): China sei Dank: Digitaler Grimm. Wrterbuch Gymnasiasten tippenin Nanjing das Grundlagenwerk der deutschen Sprache per Hand in den Computer. In: Darm-stdter Echo, 3. August 2004, S. 8.

    Maier, Thomas: China und die frouwe. In: Fuldaer Zeitung, 7. August 2004.

    Maier, Thomas: Chinesen geben deutsches Wrterbuch in den Computer ein. In: Badisches

    Tagblatt, 3. August 2004.

    Maier, Thomas: Dank China richtiges Deutsch. Grimm-Wrterbuch auf CD-ROM erschie-nen. In: Trierischer Volksfreund, 3. August 2004, S. 4.

    Maier, Thomas: Flinke Finger vollenden Forschungsprojekt. In: Die Glocke, 3. August 2004.

    Maier, Thomas (dpa): Grimms aus China. In: Wiesbadener Tagblatt vom 3. August 2004.www.main-rheiner.de/region/objekt.php3?artikel_id=1564360.

    Maier, Thomas: Gymnasiasten tippen 300 Millionen Zeichen. China sei Dank: Deutschlanderhlt ein digitales Grimm-Wrterbuch. In: General-Anzeiger. 18. August 2004, S. 13.

    Maier, Thomas: Meterweise Platz im Bcherregal gespart. Die 32 Bnde des GrimmschenWrterbuchs gibt es nun auf zwei CD-Roms Bequeme Recherchen. In: Thringische Lan-deszeitung, 7. August 2004, S. 3.

    Paterno, Wolfgang: Hasenherz. Eselsscherz. 600 Millionen von Hand eingetippte Zeichen:die digitalisierte Form des gigantischen Deutschen Wrterbuchs. In: Profil, 31/04, 26. Juli2004, S. 105.

    Patzer, Georg: Der edelste, ursprnglichste aller laute, aus brust und kehle voll erschallend.In: Stuttgarter Zeitung, Nr. 192, 20. August 2004, S. 8.

  • 7/26/2019 Abschlussbericht Grimm

    44/48

    44

    Saltzwedel, Johannes: Ein Massiv wird zur Scheibe. In: SPIEGEL SPECIAL 3/2003,S. 64/65.

    Schiffhauer, Nils: Ein Nationalheiligtum der deutschen Sprache wird zu Bits. In: FrankfurterAllgemeine Zeitung, Nr. 251, 29. Oktober 2002, S. T1f.

    Schiffhauer, Nils: Grimm im Netz. In: Augsburger Allgemeine Zeitung, Nr. 3, 4. Januar2003, S. V3.

    Schlag nach auf der CD. Grimms Wrterbuch erschienen. In: Bremer Nachrichten, 6. August2004, S. 18.

    Schlag nach auf der CD. Grimms Wrterbuch erschienen. In: Weser Kurier, 6. August 2004,S. 18.

    Schrder, Lothar: Der ganze Grimm auf nur zwei CD-Roms. In: Rheinische Post, 29. Juli2004, S. A7.

    Schwarze, Dirk: Chinesen schrieben das Wrterbuch ab. Von A bis Zypressenzweig DasGrimmsche Wrterbuch gibt es auf zwei CD-Roms. In: Hessische/Niederschsische Allge-

    meine, Nr. 165, 17. Juli 2004. Suhl, Nicole: Surfen durch 550 Jahre deutscher Sprachgeschichte. In: Lbecker Nachrichten,

    Nr. 285, 6. Dezember 2002, S. 21.

    Thormhlen, Andrea: Surfen im Meer der Wrter. 300 Millionen Zeichen abgetippt: In Chinaentstand der digitale Grimm Nationalheiligtum der deutschen Sprache auch auf CD. In:Pforzheimer Zeitung, Magazin, Nr. 67, 20. Mrz 2004, S. 51.

    Vogel, Nikolai: Auf den unabsehbaren Strecken der Sprache. Dank fleiiger Typistinnen ausChina: Das Grimmsche Wrterbuch gibt es jetzt auch digital. In: Sddeutsche Zeitung, Nr.202, 1. September 2004, S. 14.

    Voigt, Anne: Jacob und Wilhelm Grimm: Grimms Deutsches Wrterbuch auf 2 CD-ROMs.Das allerwichtigste Buch in deutscher Sprache endlich in elektronischer Version der Di-gitale Grimm. www.daf-portal.de/ticker/detail.php?id=1226 (20. Juli 2004).

    Weinmann, Martin: Der jngste Grimm. In: 150 Jahre Deutsches Wrterbuch. Kolloquium,veranstaltet von der Arbeitsstelle Deutsches Wrterbuch an der Berlin-BrandenburgischenAkademie der Wissenschaften am 8. Juli 2004.http://150-grimm.bbaw.de/links/weinmann.pdf.

    Widmann, Arno: Selten ist Globalisierung so schn. In: Berliner Zeitung vom 3. August2004, http://BerlinOnline.de/berliner-zeitung/politik/363548.html.

    Wort-Schatz. www.dwb.uni-trier.de. In: CT Magazin fr Computertechnik 18 vom 23. Au-

    gust 2004.

    b) Rundfunkbeitrge:

    Beitrag von Nils Schiffhauer im WDR 5 am 30. September 2002.

    Beitrag Der digitalisierte Grimm von Nils Schiffhauer in der Deutschen Welle am 4.November 2002.

  • 7/26/2019 Abschlussbericht Grimm

    45/48

  • 7/26/2019 Abschlussbericht Grimm

    46/48

  • 7/26/2019 Abschlussbericht Grimm

    47/48

    47

    Fr die knftige Planung von Verbesserungen ist nicht allein die weiterge-hende Auszeichnung von Bedeutung, sondern die Verknpfung des DWB mit an-deren Wrterbchern und die Ausgestaltung eines Wrterbuchverbundes, in demdas DWB eine Zentralfunktion hat, entscheidend. Die groe Attraktivitt des digi-talen DWB, die durch die hohen Zugriffszahlen auf die Internetversion und dieVerkaufszahlen der CD-ROM-Version nachdrcklich unterstrichen wird, bildet ei-ne erfolgversprechende Grundlage dafr, das Interesse an der Geschichte des Deut-schen und an seinen Dialekten zu wecken und zu frdern. Wer sich fr die Ge-schichte eines Wortes und die damit verbundene Sache oder Vorstellung interes-siert, kann sich am besten durch die Konsultation von Wrterbchern darber in-formieren. Ein digitaler Verbund von Wrterbchern bietet Perspektiven, derenReichweite und Faszination nach allem, was wir von den bisherigen Anstzen wis-sen, nicht hoch genug eingeschtzt werden knnen. In Trier sind besonders guteBedingungen fr den Aufbau eines solchen Verbundsystems von Wrterbchern

    gegeben: Zum einen wurden bereits Vorarbeiten fr die Verknpfung des DWB mitdem Mittelhochdeutschen Wrterbuchverbund geleistet, zum anderen werden imRahmen des DFG-Projekts Dialektwrterbuchverbund (www.dwv.uni-trier.de)zur Zeit die wichtigsten Dialektwrterbcher zum Westmitteldeutschen digitalisiertund miteinander verknpft. Die Verknpfung eines Teils des modernsten deutschenDialektwrterbuchs, des Pflzischen Wrterbuchs, mit den elektronischen Versio-nen des DWB und des Mittelhochdeutschen Handwrterbuchs von Matthias Lexerwurde bereits erprobt. Die Verknpfung mit den weiteren Wrterbchern (Rheini-sches Wrterbuch, Lothringisches Wrterbuch, Elsssisches Wrterbuch) soll zugegebener Zeit realisiert werden.

    Die Arbeiten zum DFG-Projekt Digitalisierung und elektronische Publikati-on des Goethe-Wrterbuchs im Internet sind ebenfalls in diesem Jahr angelaufen.Auch mit dieser Ressource wrde sich, nicht zuletzt aufgrund der zahlreichen Goe-the-Belege im DWB, eine Verlinkung anbieten. Weitere Perspektiven erffnen sichaber auch im Hinblick auf Verknpfungen mit den groen Enzyklopdien wie derOekonomischen Encyklopdie von Johann Georg Krnitz (www.kruenitz.uni-trier.de) oder auch mit anderen Wrterbchern, die, wie etwa das Grammatisch-kritische Wrterbuchvon Adelung (BSB Mnchen), im Rahmen des Retrodigitali-sierungsprogramms der DFG digitalisiert wurden.

    Innerhalb der vom Kompetenzzentrum fr elektronische Erschlieungs- undPublikationsverfahren in den Geisteswissenschaften an der Universitt Trier be-treuten Projekte werden alle Wrterbcher unter einer einheitlichen Benutzerober-flche zugnglich gemacht und mit offenen und dokumentierten Schnittstellen aus-gestattet, hnlich wie dies bei einem Groteil der digitalen Ressourcen desElectro-nic Text Centerder University of Virginia der Fall ist. Doch ist die Anbindung an-derer Wrterbcher, die unter ihren eigenen Benutzeroberflchen und ihren spezifi-schen Benutzungsaspekten zugnglich bleiben knnen, ebenso mglich, wie z. B.

  • 7/26/2019 Abschlussbericht Grimm

    48/48

    48

    die des Deutschen Rechtswrterbuchs, das bereits durchgngig auf die entspre-chenden Artikel im DWB und im Mittelhochdeutschen Wrterbuchverbund ver-weist.

    Von entscheidender Bedeutung wre aber die Einbringung der abgeschlosse-nen Teile der Neubearbeitung des DWB in den Verbund. Die viel zu wenig be-kannte und daher auch viel zu wenig benutzte Neubearbeitung umfat die am meis-ten veralteten Buchstabenstrecken A bis F und wird in wenigen Jahren abgeschlos-sen sein. Noch vor dem Abschlu sollten die bereits vorliegenden Bnde mit derErstbearbeitung verknpft werden, hnlich wie die Neubearbeitung des Oxford

    English Dictionarymit der Vorgngerauflage verbunden ist. Dieser elektronischeWrterbuchverbund aus dem alten und dem neuen DWB wrde auf lange Zeit dasmagebende worthistorische Grundlagenwerk fr die deutsche Sprache bleiben.Mit der Digitalisierung der Erstbearbeitung auf der Basis modernster Datenstan-dards sind jetzt die optimalen Voraussetzungen geschaffen, um die Kernkomponen-

    te eines noch umfassenderen Verbundes, so wie er oben skizziert wurde, zu ver-wirklichen.