Predstavljanje nesavršenog znanja

25
1 Predstavljanje nesavršenog znanja Predstavljanje nesavršenog znanja Motivacija: Racionalna odluka inteligentnog agenta ovisi o relativnim odnosima važnosti ciljeva i stupnjeva vjerovanja u ostvarenje tih ciljeva. Agent ne može garantirati ostvarenje cilja. Potrebno je uvesti predstavljanje stupnja vjerovanja u postizanje cilja, t.j. stupnja vjerovanja u istinitost rasuđivanjem izvedenog zaključka. Nesavršen zaključak ili cilj mora se izvesti iz nesavršenog poznavanja stanja svijeta (činjenica) i nesavršene baze znanja.

description

Predstavljanje nesavršenog znanja. Motivacija: Racionalna odluka inteligentnog agenta ovisi o relativnim odnosima važnosti ciljeva i stupnjeva vjerovanja u ostvarenje tih ciljeva. Agent ne može garantirati ostvarenje cilja. - PowerPoint PPT Presentation

Transcript of Predstavljanje nesavršenog znanja

Page 1: Predstavljanje nesavršenog znanja

1

Predstavljanje nesavršenog znanjaPredstavljanje nesavršenog znanja

Motivacija:

Racionalna odluka inteligentnog agenta ovisi o relativnim odnosima važnosti ciljeva i stupnjeva vjerovanja u ostvarenje tih ciljeva.

Agent ne može garantirati ostvarenje cilja. Potrebno je uvesti predstavljanje stupnja

vjerovanja u postizanje cilja, t.j. stupnja vjerovanja u istinitost rasuđivanjem izvedenog zaključka.

Nesavršen zaključak ili cilj mora se izvesti iz nesavršenog poznavanja stanja svijeta (činjenica) i nesavršene baze znanja.

Page 2: Predstavljanje nesavršenog znanja

2

Predstavljanje nesavršenog znanja

Zadatak: Oblikovati sustav temeljen na predstavljanju i

obradbi nesavršenog znanja.

Ideja: Činjenicama i pravilima (ili logičkim izrazima)

pridijeliti težinske faktore koji preslikavaju nesavršeno znanje (stupanj vjerovanja) o tim temeljnim entitetima sustava.

Definirati postupak pridjeljivanja težinskih faktora novo izvedenom zaključku.

Page 3: Predstavljanje nesavršenog znanja

3

Predstavljanje nesavršenog znanja

Shematski prikaz stanja svijeta i baze znanja: u okviru formalne logike ili prirodnog zaključivanja

pravilima (Wfi – težinski faktori činjenica, Wrj – težinski faktori

pravila):Činjenice:F1, Wf1 F2, Wf2 …Fn, Wfn Pravila:( A11, A12, …, A1k ) C1 , Wr1( A21, A22, …, A2l ) C2 , Wr2 …( Am1, Am2, …, Amp ) Cm , Wrm

Problem: semantika težinskih faktora !

Page 4: Predstavljanje nesavršenog znanja

4

Predstavljanje nesavršenog znanjaSemantika težinskih faktora: 1. NEIZVJESNOST (nepotpuno poznavanje stvarnoga

svijeta)

Npr.: Temperatura pare je 280 C, (0.8).Ovdje 0.8 predstavlja neku mjeru nepotpunog poznavanja temperature, t.j. možda pogrešku mjernog instrumenta ±20%.

Pristupi uvođenju mjere za neizvjesnost (nepotpunog poznavanja svijeta):

Predikatna Logika + vjerojatnost u automatiziranom

dokazivanju teorema (ATP)P , W1 ; Modus ponens s vjerojatnostima

premisa P Q , W2 : da li W1 i W2 mogu biti nekozistentni ?

_________ Q , W3 ? ; Kolika je vjerojatnost zaključka ?

Faktori izvjesnosti u sustavima s pravilima ("Ad Hoc" postupak).

Različite formalne logike (npr. DST) Mrežni kauzalni modeli

Page 5: Predstavljanje nesavršenog znanja

5

Predstavljanje nesavršenog znanja

Teorijske osnovice za rukovanje s NEIZVJESNOSĆU

Racionalni agent odabire akciju temeljem preferencija.

1. Vjerojatnost – pogodna za obradbu izostavljenih ili nedostajućih podataka.

2. Predstavljanjem i obradbom preferencija bavi se teorija korisnosti (engl. utility theory).

3. Teorija odlučivanja = teorija vjerojatnosti + teorija korisnosti.

(O teoriji korisnosti i teoriji odlučivanja bit će riječi kasnije o mrežnim modelima predstavljanja znanja)

Page 6: Predstavljanje nesavršenog znanja

6

Predstavljanje nesavršenog znanja

Semantika težinskih faktora:

2. NEIZRAZITOST (nejasnost, neodređenost, nepreciznost)

Npr: Temperatura pare je visoka.

visoka – neizrazita vrijednost, ali traži pripadnu mjeru i semantiku

Pristupi uvođenju mjere neizrazitog znanja: Neizrazita logika (engl. fuzzy). Neizrazita logika + faktori izvjesnosti. Teorija mogućnosti (engl. possibility theory).

Page 7: Predstavljanje nesavršenog znanja

7

Predstavljanje nesavršenog znanja

Težinski faktori predstavljeni predikatnom logikom + vjerojatnost (Nilsson, 1989.g.)

U "Modus ponens" vodimo indikatore ri:P, r1 ri = stupanj verovanja u

istinitost (P Q), r2 (engl. degree of belief)Q, r3 modeliramo s vjerojatnošću

Tumačenje preko svjetova:Svaka logička formula je istinita (T) u svijetu W1, a neistinita (F) u

svijetu W2.P se nalazi u W1 s vjerojatnošću p, a u W2 s vjerojatnošću (1 – p).Za skup od L formula postoji 2L mogućih svjetova.Stvarno postoji K 2L svjetova, jer su neki nemogući.Npr. za P=T, Q=F, nemoguć je svijet u kojem (P Q) = T.

Page 8: Predstavljanje nesavršenog znanja

8

Predstavljanje nesavršenog znanja

Logika + vjerojatnostPromatramo "Modus ponens":Konzistentni su samo svjetovi (interpretacije) sukladni tablici

implikacije:W1 W2 W3 W4 (4 svijeta) potpun i isključiv skup

P vektor p1 p2 p3 p4 pi = vjer. da je naš svijet baš Wi ( pi = 1)

__________________________P T T F F r1 = p1 + p2 (P Q) T F T T r2 = p1 + p3 + p4 Q T F T F r3 = p1 + p3

V4 vektor R vektorL = 3 (broj formula i r-ova).K = 4 (broj svjetova), K < 2L .

Indikatori ri predstavljanju sumu vjerojatnosti onih svjetova u kojima je ta formula istinita.

Page 9: Predstavljanje nesavršenog znanja

9

Predstavljanje nesavršenog znanja

Logika + vjerojatnost

Definiramo formalan sustav: Vektor Vi s (vrijednostima komponenata F=0 ili T=1) prikazuje

istinitost pojedine formule u nekom svijetu Wi . Vektore V1, ... ,Vk (sa L komponenata) grupiramo u matricu (L x

K): V. Vjerojatnosti ri grupiramo u L-dimnenzijski vektor R. Vjerojatnosti pi grupiramo u K-dimenzijski vektor P. Vjerojatnosti se povezane matričnom jednadžbom:

R = V P

Ako postoje vjerojatnosti danih formula, moguće je probabilističko rasuđivanje:

a) Koja je vjerojatnost novo generirane formule ? (npr. Q u "Modus ponensu).

b) Kako promjena jedne vjerojatnosti utječe na ostale vjerojatnosti u skupu ?

Page 10: Predstavljanje nesavršenog znanja

10

Predstavljanje nesavršenog znanja

Logika + vjerojatnostZa "Modus ponens" matrica V je:

1 1 0 0 ; P ; 0 pi 1V =1 0 1 1 ; (P Q) ; pi = 1

1 0 1 0 ; Q ;

Opažamo: Preslikavanje R = V P je linearno. Vršne vrijednosti P se preslikavaju u vršne vrijednosti R. Vršne vrijednosti P su za pi=1 (samo jedan pi zbog pi=1). Vršni vektori P su: [1,0,0,0], [0,1,0, 0], [0,0,1,0], [0,0,0,1] –

(stupčani vektori). Zbog linearnog preslikavanja vršnim P odgovaraju vršni R vektor

koji su ustvari pojedine kolone V matrice. Odnos vršnih vrijednosti može se prikazati grafički.

Page 11: Predstavljanje nesavršenog znanja

11

Predstavljanje nesavršenog znanja

Logika + vjerojatnostK=4 vrha u L=3 dimenzije:(piramida s vrhom [1,1,1])

Zaključci:1. Za dani r1 = prob(P) i r2 = prob(PQ),

ne postoji jednoznačni r3 = prob(Q)(proboj kroz piramidu). Probabilističko zaključivanje nije jednoznačan proces.

2. Postoje nekonzistentne vjerojatnosti pridijeljene istinitosnim vrijednostima već i za r1 i r2 (od ishodišta do dijagonale donje ravnine).

3. Za L rečenica i K skupova mogućih svjetova, konzistentan prostor je ograničen hiperravnimon s K vrhova u L dimenzija (analitički zahtjevno).

4. Za male matrice V, i posebne degenerirane slučajeve (npr. linearna kombinacija p-ova i r-ova) postoje aproksimacijske metode.

1

1

1

r3 = prob(Q)

r1 = prob(P)r2 = prob(PQ)

Page 12: Predstavljanje nesavršenog znanja

12

Predstavljanje nesavršenog znanja

Faktori izvjesnosti kao težinski faktori u sustavima s pravilima ("Ad Hoc"

postupak)

Faktori izvjesnosti (CF) - (engl, certainty factor)

Ideja: Činjenicama i pravilima pridružiti težinske faktore CFi koji

opisuju značaj toga entiteta u sustavu. Pri izračunu prekrivanja parova činjenica i AKO dijelova pravila

odrediti CFAKOAKO za cijeli AKO dio pravila. Temeljem izvornog CF pravila i izračunatog CFAKO za AKO stranu

pravila odrediti novi faktor izvjesnosti CFC svakog pravila. Ako je novi faktor izvjesnosti pravila manji od unaprijed

postavljenog praga, to pravilo treba isključiti iz skupa za donošenje zaključka.

Page 13: Predstavljanje nesavršenog znanja

13

Predstavljanje nesavršenog znanjaOdređivanje izvornih faktora izvjesnosti

Činjenice: pridruživanje CF svakoj činjenici je sasvim heuristički (npr. točnost mjerenja neke veličine, statistički iz povijesti itd.).

Pravila: Najčešće koristimo pojednostavljene uvjetne vjerojatnosti kao faktore izvjesnosti.

AKO: E, TADA: H, P(H | E) (ovdje samo jedan član na AKO strani)gdje je P(H | E) uvjetna vjerojatnost da će se dogoditi H (hipoteza) ako se dogodio E (evidencija). Uvjetna vjerojatnost P(H | E) može semantički preuzeti ulogu faktora izvjesnosti CF pravila.

Primjer iz medicine:Liječnik zna (iz svoje statistike) da je apriorna vjerojatnost meningitisa P(M), apriorna vjerojatnost ukrućenog vrata P(V), te vjerojatnost ukrućenog vrata kod dijagnosticiranog meningitisa P(V | M).

Kolika je vjerojatnost meningitisa ako se pojavi pacijent s ukrućenim vratom ?P(M | V) je vjer. hipoteze uz evidenciju t.j. P(H | E), odnosno faktor izvjesnosti

CF.

P(M | V) = P(V | M) · P(M) / P(V) uz uporabu Bayesovog pravila

Page 14: Predstavljanje nesavršenog znanja

14

Predstavljanje nesavršenog znanjaOdređivanje izvornih faktora izvjesnosti

Pravilo s više dijelova na AKO strani:AKO: E1, E2, ... , Em, TADA: H, P(H | E1, E2, ..., Em)Bayesovo pravilo daje:

P(E1, E2, ..., Em | Hk) P(H)P(H | E1, E2, ..., Em) = -------------------------------------

P(E1, E2, ..., Em)m istodobnih Em (simptoma) zahtijeva 2m (svi podskupovi) apriornih vjerojatnosti. Eksponencijalna složenost nedopustiva.

Redukcija složenosti: Ei su međusobno nezavisni (vrlo jako pojednostavljenje).

P(E1, E2, ..., Em | Hk) = P(E1 | Hk) · P(E2 | Hk) · … · P(Em | Hk)P(E1, E2, ..., Em) = P(E1) · P(E2) · … · P(Em)

P(E1 | Hk) P(E2 | Hk) P(Em | Hk)P(H | E1, E2, ..., Em) = P(Hk) ------------ ------------ ... ------------

P(E1) P(E2) P(Em)

Page 15: Predstavljanje nesavršenog znanja

15

Predstavljanje nesavršenog znanja

Računanje s faktorima izvjesnosti (CF)

Određivanje CF za aktivirano pravilo

Činjenice: s faktorima izvjesnosti CF1 . . . CFn Pravilo: Faktor izvjesnosti pravila CFR .

Novi faktor izvjesnosti pravila nakon slaganja svih članova na AKO strani s odgovarajućim činjenicama:

CFC = CFR min[CF1 , . . . , CFn]

Odabere se minimalni CF temeljem slaganja parova činjenica s AKO dijelovima u pravilu. Dobiveni minimalni CF množi izvorni CFR pravila.Slijedi faktor izvjesnosti zaključka (TADA strane pravila) CFC .

Page 16: Predstavljanje nesavršenog znanja

16

Predstavljanje nesavršenog znanjaUpis nove činjenice kao rezultat zaključivanja

Npr.:

Činjenica: F1 , CFF1 =0.9

Pravilo: AKO F1, TADA (F2 uz CFF2 = 0.7) , CFR = 0.8

Pravilo se aktivira (F1 AKO F1) i nova činjenica F2 upisuje se u skup činjenica, ali sa promijenjenim faktorom izvjesnosti CFF2 :

CFF2 = 0.9 x 0.7 x 0.8 = 0.504

Page 17: Predstavljanje nesavršenog znanja

17

Predstavljanje nesavršenog znanjaVišestruki doprinos istoj hipotezi

Pravilo može svojim zaključkom upisati činjenicu Fn (uz faktor izvjesnosti CFFn ) , koja već postoji u skupu

činjenica kao F (uz faktor izvjesnosti (CFF ).(Vidi raniji primjer uz pretpostavku da je F1 = F2).

Obnovljena (ista) činjenica dobiva novi faktor izvjesnosti:CF = max [ CFFn , CFF ]

Page 18: Predstavljanje nesavršenog znanja

18

Predstavljanje nesavršenog znanjaEkspertni sustav MYCIN (Stanford Univ., 1984) i faktori

izvjesnosti

Činjenice:(sensitive organism-1 penicillin -1.0)

; org-1 nije osjetljiv na pencl. Pravila:Ako: E1, E2, ... , Ek ; niz evidencijaTada: H, CF ; izvjesnost hipoteze H CF - faktor izvjenosti (confidence factor), -1, 1+1 - potpuna potvrda hipoteze-1 - potpuna potvrda negacije hipoteze0 - početna izvjesnost hipoteze (niti je potvđena niti odbačena)

Page 19: Predstavljanje nesavršenog znanja

19

Predstavljanje nesavršenog znanjaEkspertni sustav MYCIN (Stanford Univ., 1984) i faktori

izvjesnosti MB(H,E) - MD(H,E) CF = --------------------------- 1 - min MB(H,E), MD(H,E)

MB [0, 1] - mjera vjerovanja (measure of belief) u H zbog EMD [0, 1] - mjera nevjerovanja (measure of disbelief) u H zbog E

Za jedan E: 1 ako P(H) = 1MB(H,E) =

max( P(HE), P(H) ) - P(H) ------------------------------------ inače 1 - P(H) 1 ako P(H) = 0MD(H,E) =

min( P(HE), P(H) ) - P(H) ------------------------------------ inače - P(H) P(H), P(HE) su apsolutne i uvjetne vjerojatnosti

Page 20: Predstavljanje nesavršenog znanja

20

Predstavljanje nesavršenog znanjaEkspertni sustav MYCIN (Stanford Univ., 1984) i faktori

izvjesnosti Za više E: MB(H, Ei Ek) = MB(H, Ei) + MB(H, Ek) - MB(H, Ei) MB(H, Ek)Za više hipoteza Hi :MB(H1 H2, E) = min(MB(H1, E), MB(H2, E))MB(H1 H2, E) = max(MB(H1, E), MB(H2, E))Za MD, min se zamjenjuje sa max i obrnuto. Strategija upravljanja: ulančavanje unatragKonjunkcija AKO strane: min operacijom uz empirički prag CF >

0.2.Zaključak: <CF_ako_strane> * <CF_tada_strane>Kombinacija pravila (više pravila govore o istom H) npr. za dva CF: oba CF > 0: CFnovi = CF1 + CF2 - CF1*CF2 oba CF < 0: CFnovi = CF1 + CF2 + CF1*CF2 inače: CFnovi = (CF1 + CF2) / (1 -

minCF1,CF2)

Page 21: Predstavljanje nesavršenog znanja

21

Predstavljanje nesavršenog znanjaEkspertni sustav MYCIN (Stanford Univ., 1984) i faktori

izvjesnosti Problemi:

1) Npr. za više MB i jedan MD:MB(H, Ei)=0.8 za i=1,...,10 (10 dokaza u korist hipoteze)MD(H, E11)=0.2 (1 dokaz protiv hipoteze)MBuk(H, Ei) 0.999CF (0.999 - 0.2)/(1-0.2), te ostaje vrlo blizu toj vrijednosti ma

koliko dokaza u korist hipoteze H (nije sukladno intuiciji)

2) P(H1) = 0.8, P(H1 | E) = 0.9 -> CF(H1 | E) = 0.5P(H2) = 0.2, P(H2 | E) = 0.8 -> CF(H2 | E) = 0.75

Veća uvj. vjer. -> niži CF: kontradikcija

3) CF(H, e) = CF(H, i) * CF(i, e) ; i = među-hipotezaP(H | e) P(H | i) * P(i | e) ; u teoriji vjer. ne vrijedi

Page 22: Predstavljanje nesavršenog znanja

22

Predstavljanje nesavršenog znanjaDEMPSTER - SHAFER (1970) teorija - DST

Problemi teorije vjerojatnosti:Izražavanje neznanja: postoje 2 hipoteze: A, B, i nema drugih

informacija.Po teoriji vjerojatnosti: P(A) = P(B) = 0.5, te P(H)+P(H)=1DST: nema potvrde za takvo rasuđivanje.Definiramo:Okvir rasuđivanja (spoznaje) U=Hi, hipoteze (potpun skup

međusobno isključivih događaja). Neka je U = {H1, H2, H3, H4}.

Po teoriji vjerojatnosti pridjeljuje se pojedinoj hipotezi tako da: pi = 1.

DST pridjeljuje tzv. osnovne vjerojatnosti svim podskupovima od U (u našem primjeru postoji 16 podskupova) za koje postoji neka potvrda. Npr.:

m(H1) = 0.3m(H2) = 0.2m(H3) = 0.1m(H1, H3) = 0.4 (H1 ili H3)m(Ai) = 0 za ostale podskupove jer za njih nema potvrde.m(Ai) = 1 uvjet konzistentnosti (ovdje 0.3+0.2+0.1+0.4)

Page 23: Predstavljanje nesavršenog znanja

23

Predstavljanje nesavršenog znanjaDEMPSTER - SHAFER (1970) teorija – DST

m(Ak) nije vjerojatnost jer za p(Ak), Ak jedan i samo jedan događaj.

Definicije:Fokalni elementi: svi podskupovi Ai za koje m(Ai) > 0.Jezgra: unija svih fokalnih elemenata; ovdje {H1, H2, H3.

Primjer izražavanja neznanja:U = {A, B). Postoji događaj A ili B i nema drugih informacija.Teorija vjerojatnosti: p(A)=0.5, p(B)=0.5DST: pridjeljujemo osnovne vjerojatnosti svim podskupovima:m(0) = 0 ; potvrđeno je da postoji barem jedan događaj m(A) = 0 ; nije potvrđeno da je Am(B) = 0 ; nije potvrđeno da je Bm(A, B) = 1 ; sigurno je ili A ili B

Page 24: Predstavljanje nesavršenog znanja

24

Predstavljanje nesavršenog znanjaDEMPSTER - SHAFER (1970) teorija – DST

Def. funkcija vjerovanja (Bel, belief) u događaj A (A je podskup U):Bel(A) zbraja sve osnovne vjerojatnosti svih podskupova od A:Bel(A) = m(Bj) gdje su Bj svi podskupovi od A.Bel(A)=m(A) za pojedinačne elemente, dok je Bel(A)>m(A) inače. Npr. neke vrijednosti Bel za gornji slučaj:Bel(H1) = m(H1) = 0.3 ; jednako osnovnoj vjerojatnostiBel(H1, H3) = m(H1, H3)+m(H1)+m(H3) = 0.4 + 0.3 + 0.1=0.8 >

m(H1, H3)Obilježja Bel:Bel(0) = 0, nema vjerovanja u prazan skupBel(U) = 1, u potpunom skupu je sva istina (to je ujedno m(Ai))Vjerovanje u negaciju hipoteze A, t.j. Bel(A):Neka je A=H1, a A je sve osim A, t.j. sve osim H1:Bel(A) = m(H1) = 0.3Bel(A) = Bel(H2, H3, H4) = m(H2) + m(H3) + 0 (ostali m) = 0.2 +

0.1= 0.3 Bel(A) + Bel(A) 1

Page 25: Predstavljanje nesavršenog znanja

25

Predstavljanje nesavršenog znanjaDEMPSTER - SHAFER (1970) teorija – DST

Def. vjerodostojnost (plauzibilnost) A:Pl(A) = 1 - Bel(A) - to je maksimalno moguće vjerovanje u

APl(A) - Bel(A) - neizvjesnost u A.Bel(A), Pl(A) - interval sigurnosti vjerovanja u APrimjeri:0, 0 hipoteza je neistinita1, 1 hipoteza je istinita0.3, 1 hipoteza je djelomično istinita0, 1 nema dokaza u korist hipoteze0, 0.8 hipoteza je djelomično neistinita (0.2 u korist

neistinosti)0.2, 0.7 ima dokaza da je hipoteza istinita (0.2) i nestinita (0.3)

Sustav znanja s pravilima i DST indikatorima:Ako: E1 ... En, Tada: H, Bel(H), Pl(H)

Problem: eksponencijalan skup apriornog znanja.Npr. 100 zavisnih događaja, teorija vjer.: 2100 , DST: 2200 .