Segmentieren von EXMARaLDA-Daten Workshop Dortmund 2003 Thomas Schmidt, SFB 538.
-
Upload
magdalena-schleper -
Category
Documents
-
view
111 -
download
2
Transcript of Segmentieren von EXMARaLDA-Daten Workshop Dortmund 2003 Thomas Schmidt, SFB 538.
![Page 1: Segmentieren von EXMARaLDA-Daten Workshop Dortmund 2003 Thomas Schmidt, SFB 538.](https://reader035.fdocuments.net/reader035/viewer/2022062512/55204d8249795902118d4f53/html5/thumbnails/1.jpg)
Segmentieren von EXMARaLDA-Daten
Workshop Dortmund 2003Thomas Schmidt, SFB 538
![Page 2: Segmentieren von EXMARaLDA-Daten Workshop Dortmund 2003 Thomas Schmidt, SFB 538.](https://reader035.fdocuments.net/reader035/viewer/2022062512/55204d8249795902118d4f53/html5/thumbnails/2.jpg)
EXMARaLDA
![Page 3: Segmentieren von EXMARaLDA-Daten Workshop Dortmund 2003 Thomas Schmidt, SFB 538.](https://reader035.fdocuments.net/reader035/viewer/2022062512/55204d8249795902118d4f53/html5/thumbnails/3.jpg)
Zeitliche und sprachliche Struktur
![Page 4: Segmentieren von EXMARaLDA-Daten Workshop Dortmund 2003 Thomas Schmidt, SFB 538.](https://reader035.fdocuments.net/reader035/viewer/2022062512/55204d8249795902118d4f53/html5/thumbnails/4.jpg)
Partitur und Listen
![Page 5: Segmentieren von EXMARaLDA-Daten Workshop Dortmund 2003 Thomas Schmidt, SFB 538.](https://reader035.fdocuments.net/reader035/viewer/2022062512/55204d8249795902118d4f53/html5/thumbnails/5.jpg)
Parsen von Zeichenketten
Implizite Struktur (Äußerungsendzeichen) Explizite Struktur (computer-verwertbare Einheiten)
![Page 6: Segmentieren von EXMARaLDA-Daten Workshop Dortmund 2003 Thomas Schmidt, SFB 538.](https://reader035.fdocuments.net/reader035/viewer/2022062512/55204d8249795902118d4f53/html5/thumbnails/6.jpg)
Segmentieren im syncWriter
Segmentierung nur nach einer Einheit (i.d.R. Äußerungen)
Entweder Partitur oder Liste
Segmentierungs-Algorithmus ist in der Software verborgen
![Page 7: Segmentieren von EXMARaLDA-Daten Workshop Dortmund 2003 Thomas Schmidt, SFB 538.](https://reader035.fdocuments.net/reader035/viewer/2022062512/55204d8249795902118d4f53/html5/thumbnails/7.jpg)
Segmentieren in EXMARaLDA
Segmentierung nach mehreren Einheiten (Turns, Äußerungen, Wörter, nicht-phonologische Daten, Interpunktion)
Partitur und Liste(n) und Segmentierte Transkription (Datenbank!)
Segmentierung durch Endliche Maschine (Finite State Machine)
![Page 8: Segmentieren von EXMARaLDA-Daten Workshop Dortmund 2003 Thomas Schmidt, SFB 538.](https://reader035.fdocuments.net/reader035/viewer/2022062512/55204d8249795902118d4f53/html5/thumbnails/8.jpg)
Segmentieren in EXMARaLDA
Basis-Transkription (Partitur-Editor)
XML
SegmentierteTranskription(Datenbank)XML
Finite State MachineXMLFSM
![Page 9: Segmentieren von EXMARaLDA-Daten Workshop Dortmund 2003 Thomas Schmidt, SFB 538.](https://reader035.fdocuments.net/reader035/viewer/2022062512/55204d8249795902118d4f53/html5/thumbnails/9.jpg)
Finite State Machine
Formales Fundament (Reguläre Grammatiken, Reguläre Ausdrücke, Endliche Automaten, ...)
Einfachheit Flexibilität Entkopplung vom Rest
der Software (Formuliert als XML-Datei)
![Page 10: Segmentieren von EXMARaLDA-Daten Workshop Dortmund 2003 Thomas Schmidt, SFB 538.](https://reader035.fdocuments.net/reader035/viewer/2022062512/55204d8249795902118d4f53/html5/thumbnails/10.jpg)
Menü „Segmentation“ im Partitur-Editor
![Page 11: Segmentieren von EXMARaLDA-Daten Workshop Dortmund 2003 Thomas Schmidt, SFB 538.](https://reader035.fdocuments.net/reader035/viewer/2022062512/55204d8249795902118d4f53/html5/thumbnails/11.jpg)
Segmentation-Panel im Partitur-Editor
![Page 12: Segmentieren von EXMARaLDA-Daten Workshop Dortmund 2003 Thomas Schmidt, SFB 538.](https://reader035.fdocuments.net/reader035/viewer/2022062512/55204d8249795902118d4f53/html5/thumbnails/12.jpg)
To Do
Testen, Debuggen und Anpassen der FSM zum Segmentieren von HIAT-Daten
Formalisieren der Vorschriften zur Verwendung von Interpunktion (cf. Äußerungsendzeichen in Rehbein et al. 1993) Anpassen der HIAT-Konventionen
Parametrisieren des Segmentierungsprozesses
![Page 13: Segmentieren von EXMARaLDA-Daten Workshop Dortmund 2003 Thomas Schmidt, SFB 538.](https://reader035.fdocuments.net/reader035/viewer/2022062512/55204d8249795902118d4f53/html5/thumbnails/13.jpg)
Segmentierungsparameter
Äußerungsendzeichen: ? ... ! . Übrige Interpunktion: ; / , : „“ Leerzeichen Pausenpunkt(e): · Parenthesen: ( )
![Page 14: Segmentieren von EXMARaLDA-Daten Workshop Dortmund 2003 Thomas Schmidt, SFB 538.](https://reader035.fdocuments.net/reader035/viewer/2022062512/55204d8249795902118d4f53/html5/thumbnails/14.jpg)
Segmentierungsparameter
HIAT: „Turn“ Äußerung Wort, Nicht-
phonologisches Datum SFB-Projekt E3:
„Turn“ Äußerung Wort Silbe GAT:
„Turn“ Phrasierungseinheit Wort, Nicht-phonologisches Datum
DIDA „Turn“ Wort, „Nicht-morphemisierte
Äußerung“