INF2820 Datalingvistikk – V2017 · Sammenlikning av formatene 1. Trekkstrukturer i reglene •...

Post on 08-Nov-2020

2 views 0 download

Transcript of INF2820 Datalingvistikk – V2017 · Sammenlikning av formatene 1. Trekkstrukturer i reglene •...

INF2820 Datalingvistikk – V201711. Gang – 20.3Jan Tore Lønning

I dag• (Fra sist Trekkstrukturer og unifikasjon

• (J&M, seksj 15.1, J&M, seksj. 15.2)• Trekkstrukturer i NLTK

• NLTK-boka seksj. 9.2• Trekkbaserte grammatikker (=Unifikasjonsgrammatikker)

• Delvis: J&M, seksj15.3, NLTK-boka seksj 9.3• Subkategorisering:

a. Enkel løsning, grammatikk 1 og 2b. Valg på kategori, grammatikk 3 og 4c. Valg på hel struktur, grammatikk 5

• Forhold til grammatiske modeller• Implementasjon og parsing

2

Trekkstrukturer

• Lang tradisjon i lingvistikk

• Eks.: fonologi• En mengde trekk og

verdier:• For hvert trekk er det

definert hvilke verdier som er mulige

• Et skritt videre:• Hele trekkstrukturer

som verdier3

Trekkstrukturer som grafer

• To alternative notasjoner for det samme4

Directed Acyclic Graphs

(DAGs)

Attribute Value Matrices(AVMs)

Trekkstrukturer - formelt• To endelige mengder

• F = {f1, f2, …, fn}• A = {a1, a2, …, an}

• En trekkstruktur over F og A er• Atomær, dvs et element i A, eller• Ikke‐atomær. Det er et objekt. Dette inneholder

• En mengde trekk, dvs en delmengde av F: f’1, f’2, …, f’j• Til hvert av disse trekkene er det en verdi, som igjen er en trekkstruktur (atomær eller ikke‐atomær)

525. mars 2017

Begrensning:En trekkstruktur kan ikke inneholde to par av trekk og verdier (fk,  ak), (fp,  ap) der fk = fp, men ak =/= ap

Observasjon:To trekkstrukturer som inneholder de samme trekk‐verdiparene kan være identiske, men behøver ikke være 

det(som dictionaries i python)

Unifikasjon av trekkstrukturer

25. mars 2017 6

25. mars 2017 7

Unifikasjon - grafisk

8

AGRSUBJ

PERS

NUM

3rd

sg

AGR

AGRSUBJ

Unifikasjon - grafisk

9

AGR

AGRSUBJ

PERS

NUM

3rd

sg

AGRSUBJ

PERS

NUM

3rd

sg

AGR

AGRSUBJ

Subsumpsjon og unifikasjon

Subsumpsjon

• F subsummerer G• ”F er minst like generell som G”•• Hvis og bare hvis:

• F er atomær og F=G• Ellers

• For hvert trekk x i F: F(x) subsumerer G(x)

• For alle stier p, q in F:Hvis F(p) = F(q), såG(p) = G(q)

Unifikasjon

• H er unifikasjonen av F og G

• H = • Hvis og bare hvis

••• Og H er den mest

generelle slike trekkstrukturen

25. mars 2017 10

I dag• (Fra sist Trekkstrukturer og unifikasjon

• (J&M, seksj 15.1, J&M, seksj. 15.2)• Trekkstrukturer i NLTK

• NLTK-boka seksj. 9.2• Trekkbaserte grammatikker (=Unifikasjonsgrammatikker)

• Delvis: J&M, seksj15.3, NLTK-boka seksj 9.3• Subkategorisering:

a. Enkel løsning, grammatikk 1 og 2b. Valg på kategori, grammatikk 3 og 4c. Valg på hel struktur, grammatikk 5

• Forhold til grammatiske modeller• Implementasjon og parsing

11

NLTK - implementasjon>>> fs1 = nltk.FeatStruct(TENSE='past', NUM='sg')>>> fs1[NUM='sg', TENSE='past']

>>> print(fs1)[ NUM   = 'sg'   ][ TENSE = 'past' ]

>>> from nltk import FeatStruct>>> fs2 = FeatStruct(CAT='vp', AGR = fs1)

>>> print(fs2)[ AGR = [ NUM   = 'sg'   ] ][       [ TENSE = 'past' ] ][                          ][ CAT = 'vp'               ]

1225. mars 2017

NLTK - implementasjon>>> fs3 = fs2.unify(FeatStruct(

"[AGR = ?x, SUBJ = [AGR = ?x]]"))

>>> print(fs3)[ AGR  = (1) [ NUM   = 'sg'   ] ][            [ TENSE = 'past' ] ][                               ][ CAT  = 'vp'                   ][                               ][ SUBJ = [ AGR ‐> (1) ]         ]

1325. mars 2017

I dag• (Fra sist Trekkstrukturer og unifikasjon

• (J&M, seksj 15.1, J&M, seksj. 15.2)• Trekkstrukturer i NLTK

• NLTK-boka seksj. 9.2• Trekkbaserte grammatikker (=Unifikasjonsgrammatikker)

• Delvis: J&M, seksj15.3, NLTK-boka seksj 9.3• Subkategorisering:

a. Enkel løsning, grammatikk 1 og 2b. Valg på kategori, grammatikk 3 og 4c. Valg på hel struktur, grammatikk 5

• Forhold til grammatiske modeller• Implementasjon og parsing

14

Gram.1. Regler med trekkstrukturer• S  NP         VP

• NP          Det         N

• V               ’serve’

• V                    ’serves’

• En ikke‐terminal suppleres med en partiell trekkstruktur• Mulig deling mellom trekkstrukturene i en regel

• Terminalene er uendret

25. mars 2017 15

Betingelser på grammatikalitet

25. mars 2017 16

NP, VP,

V,N,DET, NP,

N,DET,

S,

the restaurant serves many fish

Hvert lokalt tre må tillates av en grammatikkregel

R1:  S  NP                   VP

Lokalt tre tillatt av regel – eks 1

• Regelen R1 svarer til et lokalt tre t2• R1 tillater t1 hvis t1 «utvider» t2,• Mer formelt: hvis t2 subsummerer t1

1725. mars 2017

NP, VP,

S, Hvert lokalt tre må tillates av en grammatikkregel

t1:

Subsumpsjon av trær

• Vi kan utvide definisjonen av subsumpsjon fra trekkstrukturer til trær med trekkstrukturer på nodene

• Et tre T subsummerer et tre T’ dersom• Trekkstrukturen på T subsummerer strukturen på T’

• Inkludert at hvis T har en kategori, så har T’ samme kategori• Hvis T har døtrene D1, D2, …, Dn, 

• så har T’ like mange døtre D’1, D’2, …, D’n, der• Di subsummerer D’i for i = 1, 2, …, n, og

• Alle delinger i T er også delinger i T’.

18

Tolkning av grammatikk

• Et tre T med trekkstrukturer er tillatt av grammatikk G hvis og bare hvis. 

• Hvis t1, t2, …, tn er alle de lokale trærne i T,så fins det tilsvarende regler i G, si g1, g2, …, gn s.a.: tre ti er tillatt av regel gi for i= 1, 2, …, n

• Hvis T’ er  et annet tre tillatt av de samme reglene g1, g2, …, gn, på tilsvarende subtrær og T’ subsummerer T, så subsummerer T også T’.

1925. mars 2017

"Det skal ikke være med mer i treet enn  det reglene krever. "

Grammatikker – to alternative format

1. Trekkstrukturer i reglene

• NLTK er et (begrenset) forsøk på å implementere dette formatet

2. Regler + likninger

• Jurafsky og Martin

25. mars 2017 20

Grammatikker – to alternative format

1. Trekkstrukturer i reglene 2. Regler + likninger

25. mars 2017 21

• S  NP       VP

• NP        Det       NOM

• V                   ’serves’•

Lokalt tre tillatt av regel –eks 1

• J&M‐format:• Det lokale treet lystrer alle likningene

2225. mars 2017

NP, VP,

S, Hvert lokalt tre må tillates av en grammatikkregel

Lokalt tre tillatt av regel –eks 2

• Regler + likninger:• Det lokale treet lystrer alle likningene

DET  the<DET AGR PERS>=3rd

• Trekkstr. i regelDET[AGR=[PERS=‘3rd’]]‐> ‘the’ 

25. mars 2017 23

DET, Hvert lokalt tre må tillates av en grammatikkregel

the

DET,

the

Sammenlikning av formatene

1. Trekkstrukturer i reglene

• Utvid ikke‐terminaler med partielle trekkstrukturer

• Variable i trekkstrukturene for deling («reentrancy»)

• Brukt for eksempel i tidlig Head‐driven PhraseStructure Grammars (HPSG)

2. Regler + likninger

• Legg likninger til CFG‐reglene• En likning mellom

• To stier, eller• En sti og en atomær verdi

• Inspirert av• PATR• Lexical‐Functional Grammar

25. mars 2017 24

Blir det samme(før evt utvidelser)

I dag• (Fra sist Trekkstrukturer og unifikasjon

• (J&M, seksj 15.1, J&M, seksj. 15.2)• Trekkstrukturer i NLTK

• NLTK-boka seksj. 9.2• Trekkbaserte grammatikker (=Unifikasjonsgrammatikker)

• Delvis: J&M, seksj15.3, NLTK-boka seksj 9.3• Subkategorisering:

a. Enkel løsning, grammatikk 1 og 2b. Valg på kategori, grammatikk 3 og 4c. Valg på hel struktur, grammatikk 5

• Forhold til grammatiske modeller• Implementasjon og parsing

25

Videre

• Vise noen eksempler på hvordan trekk og unifikasjon anvendes i moderne lingvistiske teorier, spesielt til subkategorisering:

• ved å lage en serie av grammatikk(fragment)er• gå lengre enn NLTK• være mer detaljert enn J&M• og samtidig se hvor mye av dette som kan og ikke

kan gjøres i NLTKs fcfg-er

26

Subkategorisering• Tidligere 3 VP‐regler for mønstrene:

• VP  V sleep• VP  V  NP love• VP  V  NP  NP give

• Men det er mange andre mønstre (jfr. Oblig. 2)• VP  V  NP  PP[to] give• VP  V  NP  VP[inf] persuade• VP  V  CP tell (that Mary left)• VP  V  NP  CP tell (John that Mary left)• VP  V  AP grow• VP  V  NP PP save• etc.

• Hvert verb kan forekomme i noen slike mønstre – ikke i andre• Mål: Unngå overgenerering og falske flertydigheter

2725. mars 2017

Løsning med CFG• Innføre forskjellige kategorier (ikke‐terminaler) for de forskjellige verbene, f.eks:

• VP  IV• VP  TV  NP• VP  DTV  NP  NP• IV  sleep• TV  love• DTV  give• Osv.

• Svakheter med denne løsningen:• Mange regler• Mange kategorier• Manglende generalisering: «verb er verb»

2825. mars 2017

Med eksempelgrammatikk 1

• Eksempel først i seksjon 9.3 i NLTK-boka.

29

VP[TENSE=?t, NUM=?n] ‐> V[SUBCAT=intrans, TENSE=?t, NUM=?n] VP[TENSE=?t, NUM=?n] ‐> V[SUBCAT=trans, TENSE=?t, NUM=?n] NP VP[TENSE=?t, NUM=?n] ‐> V[SUBCAT=clause, TENSE=?t, NUM=?n] SBarV[SUBCAT=intrans, TENSE=pres, NUM=sg] ‐> 'disappears' | 'walks' V[SUBCAT=trans, TENSE=pres, NUM=sg] ‐> 'sees' | 'likes' V[SUBCAT=clause, TENSE=pres, NUM=sg] ‐> 'says' | 'claims' V[SUBCAT=intrans, TENSE=pres, NUM=pl] ‐> 'disappear' | 'walk' V[SUBCAT=trans, TENSE=pres, NUM=pl] ‐> 'see' | 'like' V[SUBCAT=clause, TENSE=pres, NUM=pl] ‐> 'say' | 'claim' V[SUBCAT=intrans, TENSE=past, NUM=?n] ‐> 'disappeared' | 'walked' V[SUBCAT=trans, TENSE=past, NUM=?n] ‐> 'saw' | 'liked' V[SUBCAT=clause, TENSE=past, NUM=?n] ‐> 'said' | 'claimed'

Noen observasjoner - anvendelse

• Eksempelet viser en mulig behandling av subkategorisering av verb

• Generaliserer over verb • Men like mange regler som i en CFG • Skal se alternative måter senere

30

S NP[NUM=?x] VP[NUM=?x]VP[TENSE=?t, NUM=?n] ‐> V[SUBCAT=intrans, TENSE=?t, NUM=?n] VP[TENSE=?t, NUM=?n] ‐> V[SUBCAT=trans, TENSE=?t, NUM=?n] NP VP[TENSE=?t, NUM=?n] ‐> V[SUBCAT=clause, TENSE=?t, NUM=?n] SBar

En generalisering av formalismenEksempelgrammatikk 2

• ’serves’

25. mars 2017 31

• Så sist at grammatikk 2 sees på som en notasjonell variant av grammatikk 1

NLTK og grammatikk 2• NLTKs format for trekkgrammatikker tillater ikke regler som i

grammatikk 2.• Men vi kan «lure» NLTKs fcfg ved å innføre en ‘’dummy’’

kategori og la alle fraser være av denne kategorien, f.eks.:

3225. mars 2017

X[CAT=S]   ‐> X[CAT=NP,AGR=?x]  X[CAT=VP,AGR=?x]X[CAT=NP,AGR=?x] ‐> X[CAT=Det,AGR=?x]  X[CAT=N,AGR=?x] X[CAT=VP,AGR=?x] ‐> X[CAT=V,AGR=?x] X[CAT=NP] 

X[CAT=V,AGR =[NUM = 'sg', PERS = '3rd']] ‐> 'serves'

Obs: Parsing kan bli mindre effektiv

Grammatikk 2 i likningsformalismen

• I likningsformalismen som brukes i J&M kan grammatikker som grammatikk 2 skrives med regler som denne (fra J&M seksj. 15.5.2)

33

Eksempelgrammatikk 2: subkat.

• serves

• osv.3425. mars 2017

Tilsvarende løsning som i grammatikk 1Samme styrker og svakheter

I dag• (Fra sist Trekkstrukturer og unifikasjon

• (J&M, seksj 15.1, J&M, seksj. 15.2)• Trekkstrukturer i NLTK

• NLTK-boka seksj. 9.2• Trekkbaserte grammatikker (=Unifikasjonsgrammatikker)

• Delvis: J&M, seksj15.3, NLTK-boka seksj 9.3• Subkategorisering:

a. Enkel løsning, grammatikk 1 og 2b. Valg på kategori, grammatikk 3 og 4c. Valg på hel struktur, grammatikk 5

• Forhold til grammatiske modeller• Implementasjon og parsing

35

Eksempelgrammatikk 3

• says(Kim says that Lee is asleep)

• serves(The restaurant serves fish)

3625. mars 2017

Den samme regelen virker for alle verb som tar ett argument.

Resten i leksikon

Eksempelgrammatikk 3

3725. mars 2017

En regel for hvert mulig antall av argumenter til en V

Resten i leksikon

Eksempelgrammatikk 3

• says

• serves

3825. mars 2017

‐COMP2Forhindrer verb som tar 2 argumenter her

‐COMP2Forhindrer at disse verbene tar flere enn to argumenter

Så langt, grammatikk 3

• Færre og mer generelle regler• Mer informasjon i leksikon• Et verb velger sine argumenter

39

I NLTK

• NLTK boka drøfter denne type løsninger (seksj. 9.3), men implementerer dem ikke.

• Denne løsningen kan implementeres i NLTKs fcfgmed samme trikk som for grammatikk 2:

40

X[CAT=VP,AGR=?x] ‐> X[CAT=V,AGR=?x,SC=[COMP1=?y,‐COMP2]]    X[CAT=?y] 

X[CAT=V, AGR=[NUM=sg,PERS=3rd],SC=[COMP1=NP,‐COMP2]] ‐> 'serves'

X-bar (husker du?)• En frase har tre nivåer:

• Full frase, eks. NP (= N’’)• Ord, eks N• Midtnivå, eks. N’ (kalt ”Nominal” i J&M)

• Felles struktur for fraser av ulike kategorier: NP, VP, PP

• En del egenskaper er felles for NP og hodet N (og N’=Nom), f.eks. kasus

• En del egenskaper er delt mellom VP og V, f.eks. tempus

41

For generell form og mer informasjon, se 

Wikipedia

Bar V N PP Adj?

2 S: V’’ NP: N’’ PP: P’’

1 VP: V’ Nom: N’ PP: P’

0 V N P

42

N’’=NP

N’=NOM

N’=NOM

N’=NOM

N’=NOM

N

A’’=AP

A’’=AP

P’’=PP

P’’=PP

DET

An

old

boring

professor of German

from Sweden

Grammatikk 4 basert på X-bar• Vi representerer det som er felles mellom N, Nom og NP i et trekk «head»

• Tilsvarende for S, VP og V, og for P og PP, osv. • Hva med forskjellen mellom NP (=N’’), Nom (=N’), N (ordet)?• Flere muligheter. En av dem er å bruke et trekk for dette BAR:

43

Head-complement rule+Lexicon

• serves

• with

4425. mars 2017

En regel for verb som tar ettkomplementuavhengig av komplementets kategori

Samme regel virker for PP  P  NP

Resten i leksikon

Head complement-rules

4525. mars 2017

En regel for hvert mulig antall (0, 1, 2) av argumenteruavhengig av kategori

Resten i leksikon

Specifier rules

• hamburger

4625. mars 2017

Den første regelen vil både dekkeS  NP VPNP  DET  NOM

Eksempel

47

with a hamburger

Leksikalsk regel

48

with a hamburger

Head-complement-0-regel

49

with a hamburger

Resultat

50

with a hamburger

Leksikalsk regel (?)

51

with a hamburger

Head-specifier-regel-1

52

with a hamburger

Resultat

53

with a hamburger

Leksikalsk regel

54

with a hamburger

HC-1-regel

55

with a hamburger

Resultat

56

with a hamburger

Grammatikk 4 i NLTKs fcfg-formalisme• Kan vi uttrykke grammatikk 4 i NLTKs fcfg‐formalisme (med trikket for kategorier)?

• Noe går, men regler hvor strukturer både er delt og (delvis) instansiert er ikke mulig å uttrykke i fcfg‐grammatikker, f.eks.

5725. mars 2017

Vurdering av grammatikk 4

• Denne uttrykker langt på vei en generell X-bar grammatikk

• Noen fenomener er problematiske:• Skal enhver SPEC være BAR2, f.eks. er dette

naturlige for DET?• Er alle argumenter fulle fraser (BAR2), f.eks.

• Kari prøvde [å synge] (er dette en V’?)• Det er ikke bare kategorien til argumentet som avgjør

om det kan være komplement• F.eks. form Kari hørte [Ola synge]. (+INF)

5825. mars 2017

Grammatikk 4b• Grammatikk 4 er gjort enkel – dels for å få plass til strukturene

• serves

• serves

5925. mars 2017

Vi kunne like gjerne brukt dette formatet

I stedet for dette dette formatet

Grammatikk 4b

• og tilsvarende for de andre reglene

6025. mars 2017

Sammen med denne regelen

I stedet for dette denne regelen

Så langt

• Grammatikk 4b vil beskrive akkurat det samme som grammatikk 4

• Men med dette formatet ser vi muligheten for at hodet kan stille flere krav til sine komplementer og SPEC., f.eks. at den må ha en spesiell form

• Vi kan legge inn mere i f.eks. COMP1

61

62

Frasetyper. Kan være argum

enter. Ulik 

subkategoriseringav verb. 

(J&M, fig 15.3)

I dag• (Fra sist Trekkstrukturer og unifikasjon

• (J&M, seksj 15.1, J&M, seksj. 15.2)• Trekkstrukturer i NLTK

• NLTK-boka seksj. 9.2• Trekkbaserte grammatikker (=Unifikasjonsgrammatikker)

• Delvis: J&M, seksj15.3, NLTK-boka seksj 9.3• Subkategorisering:

a. Enkel løsning, grammatikk 1 og 2b. Valg på kategori, grammatikk 3 og 4c. Valg på hel struktur, grammatikk 5

• Forhold til grammatiske modeller• Implementasjon og parsing

63

Grammatikk 5

• Hovedide: Hodet kan spesifisere hele strukturen til sine komplementer og til specifier – ikke bare kategorien

• Spesielt kan hodet spesifisere • «Bar-nivået» på argumentene• Formen til argumentene f.eks. finit/infinite

• Grammatikkformalismen må tillate variable over hele strukturer

64

65

house

Head‐specifier regel

Head‐complement regel‐0

Eksempel på leksikalsk oppslag, eller egentlig:‐Leksikalsk oppslag +‐Leksikalsk regel som gir entallsform

66

Head‐complement‐regler

67

sleeps

68

gives

69

gives

70

persuades

Grammatikk 5 i NLTKs fcfg?

• NLTK tillater ikke variable over hele strukturer.• F.eks. kunne vi ønsket å skrive• X[HEAD=?y, VAL=[BAR=1, SPEC=?z]]  

X[HEAD=?y, VAL=[BAR=0, SPEC=?z, COMP1=?u, COMP2=False]] ?ufor

71

Grammatikk 5 i NLTKs fcfg?

• Vi kan ikke skrive grammatikk 5 direkte i NLTK selv med vårt trikk

• Vi kan ta noen av ideene og gjøre litt mer ut av subkat enn i grammatikk 3/4

72

Grammatikk 5 i likningsformatet

• I prinsippet er dette mulig• J&M, seksj. 15.3.3 skisserer tre suksessive

løsninger til subkat som svarer omtrent til våre• Grammatikk1/2• Grammatikk 3/4• Grammatikk 5

• Men gjør noen litt rare ting

73

Grammatikk 5 i likningsformatet

• F.eks burde

• Heller vært

• Hvis argumentets CAT er bestemt av <VP subcat> skal den ikke også i regel

• SUBCAT kan ikke være et HEAD-trekk fordi det ikke er delt mellom mor og datter

74

X

X

I dag• (Fra sist Trekkstrukturer og unifikasjon

• (J&M, seksj 15.1, J&M, seksj. 15.2)• Trekkstrukturer i NLTK

• NLTK-boka seksj. 9.2• Trekkbaserte grammatikker (=Unifikasjonsgrammatikker)

• Delvis: J&M, seksj15.3, NLTK-boka seksj 9.3• Subkategorisering:

a. Enkel løsning, grammatikk 1 og 2b. Valg på kategori, grammatikk 3 og 4c. Valg på hel struktur, grammatikk 5

• Forhold til grammatiske modeller• Implementasjon og parsing

75

Unifikasjonbaserte/trekkstrukturbasertegrammatiske teorier

• Flere ”moderne” grammatiske teorier/modeller/rammeverk

• Bruker: trekk («features») og unifikasjon• Leksikaliserte:

• Mye informasjon i leksikon• Få frasestrukturregler.

• Inklusive• Generalized Phrase Structure Grammar (GPSG)• Head‐Driven Phrase Structure Grammar (HPSG)• Lexical‐Functional Grammar (LFG)

76

Hvert rammeverk består av

1. Grunnleggende unifikasjonsformalisme2. Utvidelser og begrensninger i forhold til denne 

formalismen3. Prinsipper som gjelder for alle menneskespråk4. Språkspesifikke regler og leksika

• ( (2) og (3) er ofte nøstet i hverandre og vanskelige å skille.)

77

HPSG og oss

• HPSG endrer og utvider det vi har gjort:• Lister for subkategorisering av komplementer

• Bruk av typer og arv

78

Lister (HPSG)

• HPSG bruker lister i VAL(ency) trekket• BAR2 tilsv. tom SPEC-liste og tom COMPS-liste• BAR1 tilsv. tom COMPS-liste

79We HPSG

persuades

Fotnote

• Vi har i HPSG skilt argumentene mellom• SUBCAT som en liste av komplementer• SPEC, specifier, f.eks. subjekts-NP til et verb

• Begge lærebøkene har også eksempler med SUBCAT-lister:

• NLTK har en liste av CAT-navn (tilsv. grammatikk 3/4)• J&M har en liste av strukturer (tilsv. grammatikk 5)

• Begge legger også specifier (subjekts NP) (først) på SUBCAT-lista og har ikke SPEC-trekk

• Tilsvarer en tidlig variant av HPSG

80

I dag• (Fra sist Trekkstrukturer og unifikasjon

• (J&M, seksj 15.1, J&M, seksj. 15.2)• Trekkstrukturer i NLTK

• NLTK-boka seksj. 9.2• Trekkbaserte grammatikker (=Unifikasjonsgrammatikker)

• Delvis: J&M, seksj15.3, NLTK-boka seksj 9.3• Subkategorisering:

a. Enkel løsning, grammatikk 1 og 2b. Valg på kategori, grammatikk 3 og 4c. Valg på hel struktur, grammatikk 5

• Forhold til grammatiske modeller• Implementasjon og parsing

81

Implementasjon av unifikasjon

• Du må kunne:• Gitt to trekkstrukturer f1 og f2:

• Avgjøre om de er unifiserbare• Hvis de er unifiserbare, konstruere en struktur f3 som er

resultatet av å unifisere de to.

• J&M seksj 15.4 er ikke pensum:• Trenger ikke å kunne konstruksjonen med ekstra

pekere

82

Parsing med trekkgrammatikker

• Vi har sett hvordan vi kan bygge trær med trekkstrukturer for setninger ut i fra en trekkgrammatikk

• Dette kan kombineres med alle parsingalgoritmene vi har sett for CFG:

• Parsingalgoritmen holder rede på rekkefølgen vi bygger treet

• Det er en komplikasjon når vi skal bygge flere trær

• Enten det er ved baktrackking: RD, SR• Eller ved tabell: CKY, Chart

83

Eksempel

• S  NP[AGR=?x] VP[AGR=?x] • NP[AGR=?x]  Det[AGR=?x] Nom[AGR=?x]• Nom[AGR=?x]  N[AGR=?x]• Nom[AGR=?x]  N[AGR=?x] Nom[AGR=?x]• Det  ‘the’• N[AGR=sg]  hamburger• N[AGR=pl]  resturants

84

Eksempel fortsatt

85

restaurantshamburgerthe restaurantshamburgerthe

N[NUM=sg]

Nom[NUM=sg]

NP[NUM=sg]

Det[NUM=sg] Det[NUM=pl] N[NUM=sg] N[NUM=pl]

Nom[NUM=pl]

Nom[NUM=pl]

NP[NUM=pl]

N[NUM=pl]

Den ene analysen gjør the til sg, den andre gjør den til pl

Løsning

• En backtrack-parser må kunne omgjøre unifikasjoner som ikke fører frem, her at the’sNUM er sg.

• En tabellparser (CKY eller Chart) som vil lage begge alternativ må kopiere strukturer før de unifiseres

• Være klar over problemet og prinsippet for løsninger

• Ikke se på detaljer, • J&M, seksj 15.5 ikke pensum.

8625. mars 2017