EXMARaLDA – ein System zur Transkription
gesprochener Sprache
Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg
Datenbank „Mehrsprachigkeit“
• Über 2200 Transkriptionen gesprochener Sprache
• verschiedene Datentypen: Spracherwerbsdaten, gedolmetschte Diskurse, Expertendiskurse, Vortragsdiskurse, Radiosendungen, Interviews, „freie“ Diskurse etc.
• Über 14 verschiedene Sprachen (Deutsch, Französisch, Italienisch, Spanisch, Portugiesisch, Englisch, Schwedisch, Dänisch, Norwegisch, Japanisch, Chinesisch, Russisch, Türkisch, Luganda)
• verschiedene theoretische Hintergründe: generative Grammatik, funktionale Pragmatik, etc.
Datenbank „Mehrsprachigkeit“
Problem: „variety of tools and formats“
Daten werden in Formaten gespeichert und mit Werkzeugen bearbeitet, die speziell auf die Zielsetzung des jeweiligen Projektes ausgerichtet sind
es ist schwierig bis unmöglich, Daten zwischen Projekten auszutauschen, gemeinsam auszuwerten etc.
Datenbank „Mehrsprachigkeit“
syncWriter• interlinearer Text• nur auf Macintosh• binäre Daten
Datenbank „Mehrsprachigkeit“
LAPSUS• Satzdatenbanken• nur auf DOS• Tabellenstruktur, keine Simultaneität
Datenbank „Mehrsprachigkeit“
syncWriter Verbmobil
HIAT-DOS LAPSUS (dBase / ACCESS)
?
Auswertung: mit Hilfe der Datenbank kann die Transkription quantitativ ausgewertet werden.
syncWriter(K1,K2,E5)
Verbmobil(K3)
dBase(E2)
...
EXMARaLDAEin-/ Ausgabe Analyse
Datenbank „Mehrsprachigkeit“
EXMARaLDA
Eingabemethode: Simple EXMARaLDA (Zeilennotation)
EXMARaLDA
Eingabemethode: Partitureditor (Partitur-Notation)
EXMARaLDAAusgabemethode: HTML mit Hyperlinks
EXMARaLDAAusgabemethode: RTF (Unicode)
Ich verstehe davon weder hinauf noch hinunter.
Ich schaue wie ein Schaf auf ein neues Tor.
Ich höre ein Buch aus dem Himmel.
EXMARaLDA
Bisher:• Partitureingabe / -ausgabe, Zeileneingabe
Demnächst:• Segmentierung:
- in Äußerungen Zeilenausgabe- in Wörter Wortlisten, Index Suche, ...
• Austausch mit anderen Transkriptionstools- TASX-Annotator (Uni Bielefeld)- ELAN (MPI Nijmegen)- AG-Tools (LDC Philadelphia)- ANVIL (Uni Saarbrücken)
TASX Annotator
ELAN
AG-Toolkit: TableTrans
ANVIL
Top Related