7/25/2019 Arabisch Topologische Dependenzgrammatik
1/28
1
FR 6.2 InformatikUniversitt des Saarlandes
Topologische Dependenz-grammatik frs Arabische
Abschlussbericht des Fortgeschrittenenpraktikums
Von Marwan OdehBetreut von Ralph Debusmann
Unter der Aufsicht von Prof. Gert Smolka
08. Dezember 2004
7/25/2019 Arabisch Topologische Dependenzgrammatik
2/28
2
Inhaltsverzeichnis
Abschnitt 1................................................................................................41. Einleitung ........................................................................................42. Phnomene.....................................................................................5
Phnomen 1: Verbstellung.................................................................5Beispiel 2.1.1: ..............................................................................5Beispiel 2.1.2: ..............................................................................6Beispiel 2.1.3: ..............................................................................6Beispiel 2.1.4: ..............................................................................7Beispiel 2.1.5: ..............................................................................7
Phnomen 2: Nominalphrasen-Stellung.............................................8Beispiel 2.2.1: ..............................................................................8
Beispiel 2.2.2: ..............................................................................9Phnomen 3: Adjektive und Adjektivartikel ........................................9Beispiel 2.3.1: ..............................................................................9Beispiel 2.3.2: ............................................................................10Beispiel 2.3.3: ............................................................................10
Phnomen 4: Mafool Motlak ............................................................11Beispiel 2.4.1: ............................................................................11Beispiel 2.4.2: ............................................................................11Beispiel 2.4.3: ............................................................................11
Phnomen 5: Verb-Subjekt-Genus-Agreement................................12Beispiel 2.5.1: ............................................................................12Beispiel 2.5.2: ............................................................................12Beispiel 2.5.3: ............................................................................12Beispiel 2.5.4: ............................................................................12
Abschnitt 2..............................................................................................13Arabisch mit Hilfe von Topologischer Dependenzgrammatik..............13
1. IDTeil........................................................................................131.1 Verben.....................................................................................13
Intransitive Verben .....................................................................14
Transitive Verben.......................................................................15Ditransitive Verben.....................................................................151.2 Artikel ......................................................................................161.3 Adjektive..................................................................................171.4 Appositionen ...........................................................................171.5 Korrelationen...........................................................................171.6 Adverbien ................................................................................171.7 Mafool Motlak..........................................................................181.8 Prpositionen ..........................................................................181.9 Nomina....................................................................................181.10 Zusammengesetzte Nomina .................................................19
Beispiel 1.10.1: ..........................................................................19
7/25/2019 Arabisch Topologische Dependenzgrammatik
3/28
3
Beispiel 1.10.2: ..........................................................................20Beispiel 1.10.3: ..........................................................................20Beispiel 1.10.4: ..........................................................................21
1.11 Namen...................................................................................21
2. LP-Teil........................................................................................222.1 Verben.....................................................................................232.2 Artikel ......................................................................................232.3 Das Adjektive ..........................................................................242.4 Appositionen ...........................................................................242.5 Korrelationen...........................................................................242.6 Adverbien ................................................................................252.7 Mafool Motlak..........................................................................252.8 Prpositionen ..........................................................................262.9 Nomina...................................................................................26
2.10 Zusammengesetzte Nomina .................................................262.11 Namen...................................................................................27
Abschnitt 3..............................................................................................27Abschluss............................................................................................27
Literatur ..................................................................................................28
7/25/2019 Arabisch Topologische Dependenzgrammatik
4/28
4
Abschnitt 1
1. Einleitung
In meinem Fortgeschrittenenpraktikum habe ich mir vorgenommen, mitdem Grammatikformalismus Topologische Dependenzgrammatik (TDG)(Duchier und Debusmann 2001, ACL-Konferenz) und (Debusmann 2001,Diplomarbeit) einige interessante Phnomene des Arabischen zu model-lieren.
Arabisch ist in vielerlei Hinsicht eine interessante Sprache:
a) Arabisch wird statt von links nach rechts von rechts nach links ge-schrieben,b) es besitzt einzigartige grammatische Kategorien (Adjektivartikel und
Mafool Motlak),c) hat eine reiche Morphologie,d) und auf Satzebene eine sehr freie Wortstellung, freier sogar als im
Deutschen.
Whrend Punkt 1 bei der grammatischen Modellierung keine Schwierig-keiten bereitet, stellen die Punkte 2-4 herkmmliche Grammatikforma-
lismen, die auf kontextfreier Grammatik basieren, vor einige Probleme.Besonders die reiche Morphologie und die daraus resultierende freieWortstellung sind hier problematisch.
In diesem Fopra zeige ich, wie diese Schwierigkeiten auf elegante Weisemit Topological Dependency Grammar (TDG) gelst werden knnen.Dazu habe ich eine toy grammar entwickelt, die u.a. die einzigartigenKategorien des Adjektivartikels, des Mafool Motlak, die reiche Morpho-logie, und die auf Satzebene freie Wortstellung adquat behandelt, und
die ich in dieser Ausarbeitung ausfhrlich erklre.
Ich beginne mit einer Beschreibung einiger interessanter Phnomene(Teil 1), die ich in meiner Grammatik behandele, bevor ich die Gramma-tik selbst beschreibe, wobei ich besonderen Wert auf den Aufbau desLexikons und der lexikalischen Klassen legen werde (Teil 2). In Teil 3schliee ich die Ausarbeitung ab.
7/25/2019 Arabisch Topologische Dependenzgrammatik
5/28
5
2. Phnomene
Phnomen 1: VerbstellungIn einem arabischen Satz kann das Verb an jeder Stelle stehen, solangees nicht dafr sorgt, dass eine Nominalphrase unterbrochen wird:
Beispiel 2.1.1:
- Das Verb tuhibu ist im folgenden Satz an erster Stelle (am Anfang des
Satzes1
). Das Suffix -u von fatat-u zeichnet dieses als Subjekt aus:
mohammed-a fatat-u al tuhibu Mohammed Mdchen das liebt
Abbildung 1 : ID-Baum
Abbildung 2 :LP-Baum
1Ich werde die arabischen Beispielstze konsequent von rechts nach links schreiben. Daher ist in Bei-spiel II.1.1 das Verb tuhibu ganz rechts an erster Stelle.
7/25/2019 Arabisch Topologische Dependenzgrammatik
6/28
6
Beispiel 2.1.2:
- In diesem Beispiel steht das Verb an zweiter Stelle:
mohammed-a Tuhibu fatat-u al Mohammed Liebt Mdchen das
Abbildung 3:ID-Baum
Abbildung 4:LP-Baum
Beispiel 2.1.3:
- Und in diesem Beispiel an dritter Stelle:tuhibu mohammed-a fatat-u al liebt Mohammed Mdchen das
7/25/2019 Arabisch Topologische Dependenzgrammatik
7/28
7
Abbildung 5:ID-Baum
Abbildung 6:LP-Baum
Wie bereits oben angedeutet knnen Nomina im Arabischen mit Kasus-Markierern suffixiert werden. So zeichnet die Endung -u ein Nomen als
Subjekt, und die Endung -a als Objekt aus. Da das transitive Verb tu-hibu genau ein Subjekt und genau ein Objekt verlangt, sind die beidenfolgenden Stze dann ungrammatisch:
Beispiel 2.1.4:*Mohmmed-u fatat-u al tuhibu
Beispiel 2.1.5:
*Mohammed-a fatat-a al tuhibu
In Beispiel 2.1.4 sind beide Nomina als Subjekt markiert, und in 2.1.5 alsObjekt. Also gibt es in 2.1.4 ein Subjekt zuviel und ein Objekt zuwenig.2.1.5 verhlt sich symmetrisch.
7/25/2019 Arabisch Topologische Dependenzgrammatik
8/28
8
Phnomen 2: Nominalphrasen-Stellung
Nicht nur das Verb, sondern auch die Nominalphrasen knnen innerhalbdes Satzes frei bewegt werden. Die Voraussetzung dafr ist, dass ausihrer morphologischen Markierung eindeutig hervorgeht, welche syntak-tische Funktion sie ausben. Im untenstehenden Beispiel steht so Mo-hammed-a vor al fatat-u:
Beispiel 2.2.1:
fatat-u al mohammed-a tuhibu
Mdchen das Mohammed liebt
Abbildung 7: ID-Baum
Abbildung 8: LP-Baum
Genauso grammatikalisch ist aber auch der folgende Satz, in dem dieOrdnung der beiden Nominalphrasen vertauscht ist. Dieses Phnomenist brigens vergleichbar mit dem sogenannten Scrambling im Deut-schen, das die vielen mglichen Permutationen von Verbkomplementen
im deutschen Mittelfeld beschreibt:
7/25/2019 Arabisch Topologische Dependenzgrammatik
9/28
9
Beispiel 2.2.2:
mohammed-a fatat-u al tuhibu Mohammed Mdchen das liebt
Phnomen 3: Adjektive und Adjektivartikel
Adjektive verhalten sich im Arabischen grundlegend anders als im Deut-schen oder Englischen. Zum einen stehen Adjektive hinter, und nicht vor
den Nomina. Zum anderen besitzt das Arabische die einzigartige Kate-gorie des Adjektivartikels: Jedes der das Nomen modifizierenden Ad-jektive muss einen eigenen Artikel haben,eben den erwhnten Adjektivartikel. Dieser muss zudem die gleiche En-dung tragen wie das Nomen. Hier ein Beispiel:
Beispiel 2.3.1:
tuhibu mohammed-a tawilat-u al jamilat-u al fatat-u al liebt Mohammed groes das schnes das Mdchen das
Abbildung 9 : ID-Baum
7/25/2019 Arabisch Topologische Dependenzgrammatik
10/28
10
Abbildung 10 : LP-Baum
Hier wird das Nomen fatat-u von zwei Adjektiven (jamilat-u und tawi-lat-u) modifiziert, die jeweils einen eigenen Adjektivartikel bekommen.
Auerdem haben die Adjektive die gleiche Endung -u, wie das entspre-chende Nomen fatat-u, d.h. sie kongruieren.
Ich werde die Kongruenz zwischen Adjektiven und Nomina ebenso wieandere morphologische Phnomene mit der Idee des Agreement be-handeln. Hierbei ordne ich jedem Wort eine Menge von mglichen
Agreement-Tupeln zu, die aus den drei Komponenten Kasus (Nominativ,Akkusativ, jar fr Objekte von Prpositionen), Genus (Maskulinum undFemininum) und Numerus (Singular und Plural) bestehen. Jeder Knoten
in der letztendlichen Analyse whlt aus dieser Menge genau ein Agree-ment-Tupel aus.
Nun kann ich fr alle Dependenzkanten von Nomina zu Adjektiven dieAgreement-Tupel beiden beteiligten Knoten gleichsetzen, um den Effektder Kongruenz zu erzielen. Damit schliee ich korrekterweise die folgen-den, ungrammatischen Stze aus:
Beispiel 2.3.2:
*tuhibu mohammed-a tawilat-u al jamilat-a al fatat-u al
Beispiel 2.3.3:*tuhibu mohammed-a tawilat-a al jamilat-u al fatat-u al
In Beispiel 2.3.2 stimmt die Markierung von jamilat-a (Akkusativ-Suffix)nicht mit der des Nomens fatat-u (Nominativ-Suffix) berein. In 2.3.3stimmt die Markierung von tawilat-a nicht.
7/25/2019 Arabisch Topologische Dependenzgrammatik
11/28
11
Phnomen 4: Mafool Motlak
Das Arabische bietet das einzigartige Phnomen des Mafool Motlak.Hierbei wird das finite Verb am Ende eines Satz wiederholt, um seineBedeutung zu verstrken. Hier ein Beispiel:
Beispiel 2.4.1:
laiban walad-u al laib-a spielen Kind das spielte
Die Bedeutung dieses Satzes ist in etwas Das Kind spielte sehr inten-siv. Das wiederholte Verb am Ende des Satzes hat genau die Kategorieoder syntaktische Funktion Mafool Motlak. Diese knnen nur von man-chen Verben gebildet werden. Morphologisch werden Verben dieser Ka-tegorie mit dem Suffix -an ausgestattet. Hier ist eine ID-Analyse des o-bigen Beispiels:
Abbildung 11: ID-Baum
Interessanterweise knnen auch mehrere Mafool Motlaks benutzt wer-den, um das modifizierte Verb noch mehr zu verstrken:
Beispiel 2.4.2:laiban laiban walad-u al laiba
Beispiel 2.4.3:laiban laiban laiban walad-u al laiba
7/25/2019 Arabisch Topologische Dependenzgrammatik
12/28
12
Phnomen 5: Verb-Subjekt-Genus-Agreement
Interessanterweise knnen die finiten Verben im Arabischen ihren Sub-jekten deren Genus vorschreiben. So bedeuten die beidenVerbformen tuhibu und yuhibu beide liebt, erstere kann jedoch nurfr feminine Subjekte, und letztere fr maskuline Subjekte verwendetwerden.
Beispiel 2.5.1:fatat-a al mohammed-u yuhibu
Beispiel 2.5.2:*fatat-a al mohammed-u tuhibu
Beispiel 2.5.3:mohammed-a fatat-u al tuhibu
Beispiel 2.5.4:
*mohammed-a fatat-u al yuhibu
In Beispiel 2.5.1 ist das Subjekt mohammed-u korrekterweise maskulinund kongruiert mit dem geforderten Genus des Verbs yuhibu. Beispiel2.5.2 ist ungrammatikalisch, weil das Verb tuhibu ein feminines Subjektfordert, jedoch ein maskulines (mohammed-u) erhlt. Die Beispiele2.5.3 und 2.5.4 verhalten sich symmetrisch.
Ich modelliere die Forderung des Verbs nach Genus-Kongruenz wiefolgt. Jedes Verb bekommt im Lexikon eine Abbildung von syntaktischenFunktionen auf Mengen von Agreement-Tupeln zugeordnet. Abhngigvon dieser Abbildung und jeweiligen Kantenlabel bestimme ich nun das
Agreement-Merkmal der Tchter. Z.B. lege ich fest, dass Verben wie y-uhibu zum einen Nominativ-Kasus vom Subjekt fordern, und zudem,dass es maskulin ist. tuhibu fordert ebenfalls Nominativ-Kasus, und zu-dem, dass das Subjekt feminin ist.
7/25/2019 Arabisch Topologische Dependenzgrammatik
13/28
13
Abschnitt 2
Arabisch mit Hilfe von Topologischer Dependenz-
grammatik
In diesem Abschnitt beschreibe ich die Grammatik, die ich im Laufe mei-nes Forschungspraktikums geschrieben habe. Ich beginne mit dem ID-Teil (Immediate Dominance) in Abschnitt 1, bevor ich weiter gehe mitdem LP-Teil (Linear Precedence) in Abschnitt 2.
1. IDTeil
Zunchst definiere ich die Menge der syntaktischen Funktionen (gram-matische Rollen):
Rolle Steht fr
adj Adjektivadjart Adjektivartikeladv Adverbapp Appositionart Artikelcor Korrelation
gen Genitivmm Mafool Motlakobj1 Erste Objektobj2 Zweite Objektpp Prposition Phase
prep Prposition
prepobj Prposition Objektsubj Subjekt
1.1 Verben
Ich definiere zunchst die Klasse t-fin-idfr finite Verben:
:
:
{}
{ , *, *, *}
id
id
labels
t fin id valency subj adv pp mm
=
7/25/2019 Arabisch Topologische Dependenzgrammatik
14/28
14
a) labelsid: Da ich keine Nebenstze behandle, ist jedes finite Verb dieWurzel des Baums (kann keine eingehenden Kanten haben).
b) valencyid:Finite Verben verlangen ein Subjekt, und knnen von je-weils beliebig vielen Adverbien, prpositionalen Modifikatoren, und
Mafool Motlaks modifiziert werden.Finite Verben bestimmen zustzlich die Menge der mglichen Agree-ment-Tupel ihrer Subjekte (wie in Abschnitt 1 erlutert).
Intransitive Verben
Der ID-Teil des lexikalischen Typs fr intransitiven Verben sieht so aus:
t intransitiv id =t-fin-id &:{}
:{}
id
id
labels
valency
D.h., intransitive Verben erben von der Klasse fr finite Verben, und f-gen keine weiteren Argumente hinzu. Ich schreibe das kaufmnnischeund &fr die Kombination von lexikalischen Klassen.
Die folgende Grafik zeigt die mglichen ausgehenden Kanten eines Kno-tens, der einem intransitiven Verb entspricht:
Da ID-Bume ungeordnet sind, ist die Ordnung der Kanten hier nicht re-levant. Untenstehend zeige ich nun eine Beispielanalyse eines Satzesmit intransitivem Verb:
kathiranoft
tadhak-ulacht
fatat-uMdchen
aldas
art
subjadv
mmppadvsubj
t-intransitive-id
7/25/2019 Arabisch Topologische Dependenzgrammatik
15/28
15
Transitive Verben
Transitive Verben erben von intransitiven Verben und verlangen zustz-lich entweder ein direktes Objekt (obj1) oder ein prpositionales Kom-plement (prep):
t-transitive-id = t-intransitive-id & [ ]:{( 1| )}idvalency obj prep
Das Ergebnis sieht so aus:
t-transitive-id =:{}
:{ , *, *, *, ( 1| )}
id
id
labels
valency subj adv pp mm obj prep
Die folgende Grafik beinhaltet die mglichen ausgehenden Kanten einesKnotens, der einem transitiven Verb entspricht (im Beispiel mit obj1-Komplement):
Ditransitive Verben
Ditransitive Verben erben von transitiven Verben, und ergnzen ein indi-rektes Objekt-Komplement (obj2):
t-ditransitive-id = t-transitive-id & [ ]:{ 2}idvalency obj
Das Ergebnis sieht man wie folgt:
t-ditransitive-id=:{}
:{ , *, *, *, ( 1| ), 2}
id
id
labels
valency subj adv pp mm obj prep obj
Hier ist eine Grafik, die die mglichen ausgehenden Kanten eines ditran-sitiven Verbs zeigt:
obj1
mmpp
advsubj
t-transitive-id
7/25/2019 Arabisch Topologische Dependenzgrammatik
16/28
16
1.2 Artikel
Artikel erben vom lexikalischen Typ t-art-id:
:{ , }
:{}
id
id
labels art adjartt art id
valency
=
Abhngig von seiner eingehenden Kante kann ein Artikel entweder voneinem Nomen oder von einem Adjektiv abhngig sein:
normaler Artikel Adjektivartikel(von Nomen abhngig) (von Adjektiv abhngig)
t-art-id t-adjart-id
oder
subj
obj1mm
ppadvsubj
t-ditransitive-id
art adjart
7/25/2019 Arabisch Topologische Dependenzgrammatik
17/28
17
1.3 Adjektive
Adjektive erben vom folgenden lexikalischen Typ:
}{:
}{:
adjartvalency
adjlabelsidadjt
id
id
D.h., Adjektive haben eine eingehende Kante, die mit adjbeschriftet ist,und verlangen einen Adjektivartikel:
1.4 Appositionen
Die eingehende Kante von Appositionen ist mit appgelabelt:
:{ }
:{}
id
id
labels appt app id
valency
=
1.5 Korrelationen
Korrelationen haben eingehende Kante cor:
:{ }
:{}
id
id
labels cort cor id
valency
=
1.6 Adverbien
Und Adverbien haben eine eingehende Kante, die mit advgelabelt ist:
:{ }
:{}
id
id
labels advt adv id
valency
=
adj
adjart
t_adj_id
7/25/2019 Arabisch Topologische Dependenzgrammatik
18/28
18
1.7 Mafool Motlak
Mafool-Motlak erbt vom folgenden lexikalischen Typ:
*}*,{:}{:
ppadvvelencymmlabelsidmmt
id
id
1.8 Prpositionen
Ich unterscheide zwei Klassen von Prpositionen:
a. Prpositionale Komplemente (eingehendes Kantenlabel:prep):
:{ }
:{ }
:{ : $ }
id
id
id
labels prep
t prep id valency prepobj
outagrs prepobj jar
=
Hier ist prepobjdas von der Prposition abhngige Nomen. Die Mengeoutagrsdient zur Festlegung der Abbildung von ausgehenden Kantenla-bels auf mgliche Agreement-Tupel. Hier lege ich fest, dass das Objektder Prposition den Kasusjarerhlt.
b. Prpositionale Adjunkte (eingehendes Kantenlabelpp):
:{ }
:{ }
:{ : $ }
id
id
id
labels pp
t pp id valency prepobj
outagrs prepobj jar
=
Diese Klasse verhlt sich bis auf das eingehende Kantenlabel analog.
1.9 Nomina
[ ]:{ , 1, 2, , }idt nomen id labels subj obj obj gen prepobj =
Ein Nomen kann subj, obj1, obj2, gen, oder prepobj werden. Ich unter-scheide zwischen zusammengesetzten Nomina und Namen.Beide unterscheiden sich in ihren ausgehenden Kanten.
7/25/2019 Arabisch Topologische Dependenzgrammatik
19/28
19
1.10 Zusammengesetzte Nomina
Zusammengesetzte Nomina erben vom Typ t-nomen-id, und ergnzendiesen um eine Reihe von optionalen Dependenten: Korrelationen, Ap-
positionen, Adjektive, Genitive und Artikel:t-znomen-id = t-nomen-id &[ ]:{ *, *, *, ?, ?}idvalency cor app adj gen art
Die unten stehende Grafik zeigt die mglichen eingehenden bzw. aus-gehenden Kanten:
Beispiel 1.10.1:
In diesem Beispiel wird das Nomen raees (Prsident) vom Genitiv aljamiat (der Universitt) und von der Korrelation nafsaho (selbst) modi-fiziert:
nafsaho jamiat al raees selbst Universitt der Prsident
artgenadjappcor
t-znomen-id
subj,obj1,obj2,gen,prepobj
7/25/2019 Arabisch Topologische Dependenzgrammatik
20/28
20
Beispiel 1.10.2:
Im folgenden Beispiel wird raees zustzlich von der Apposition dr-m-salami modifiziert:
nafsaho dr-m-salami jamiat al raees .. selbst Dr. M. Salami Universitt der Prsident
Beispiel 1.10.3:
In diesem Beispiel kommt der eingebettete Genitiv al qahira (von Kairo)hinzu:
nafsaho dr-m-salami qahira al jamiat raees .. selbst Dr. M. Salami Kairo von Universitt Prsident
7/25/2019 Arabisch Topologische Dependenzgrammatik
21/28
21
Beispiel 1.10.4:
Und im folgenden Beispiel kommt noch das Adjektiv (samt Adjektivarti-kel) al jadid (der neue) dazu:
nafsaho dr-m-salami jadid al qahira al jamiat raees .. selbst Dr. M. Salami neue Kairo von Universitt Prsident
1.11 Namen
Namen erben von folgendem lexikalischen Typ:
t-namen-id = t-nomen-id &[ ]:{ *, *, *, ?}idvalency cor app adj gen
Das Ergebnis ist derselbe Typ wie t-znomen-id, ohne Artikel
(Namen knnen im Arabischen keinen Artikel haben).
7/25/2019 Arabisch Topologische Dependenzgrammatik
22/28
22
2. LP-Teil
Wie im ID-Teil definiere ich zunchst die Menge der Kantenlabels. Indiesem Fall sind dies nicht syntaktische Funktionen, sondern topologi-
sche Felder:
Top. Feld Steht fr
a Adjektiv-Kopfadjartf Adjektivartikel
adjf Adjektiv-Dependentadvf Adverbappf Appositionartf
Artikelcorf Korrelationgenf Genitiv
m Mafool Motlak-Kopfmmf Mafool Motlak-Dependent
n Nomen-Kopfp Prposition-Kopf
prepobjf Prpositionsobjektsf Satzfeld
In dieser Menge gibt es drei Gruppen von Labels:
a) Labels, die genau den ID-Kantenlabels entsprechen (adjartf, adjf,advf, appf, artf, corf, genf, mmf, prepobjf)
b) Labels, die nur Knotenlabels sein knnen und den jeweiligen topo-logischen Kopf respektive seiner topologischen Dependenten ord-nen (a, m, n, p)
c) das Label sf, das Satzfeld, in dem alle verbalen Dependentenlanden knnen, und die dort permutiert werden knnen. Sf kannauch Knotenlabel sein, damit Verben frei angeordnet werden kn-nen.
Die Menge der topologischen Felder ist folgendermaen total geordnet:
corf < appf < adjf < genf < n < artf
Top Related