Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle...

29
Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1 in Ingegneria Gestionale e L2 in Ingegneria Informatica III ciclo

Transcript of Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle...

Page 1: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

Sistemi di Supporto alle

Decisioni I

Lezione 7

Chiara MocenniCorso di laurea L1 in Ingegneria Gestionale e

L2 in Ingegneria InformaticaIII ciclo

Page 2: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

Reti Bayesiane

Page 3: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

• Le reti Bayesiane sono modelli grafici della conoscenza in un dominio incerto. Basandosi sulla regola di Bayes, esprimono relazioni di dipendenza condizionale (archi) tra le variabili in gioco (nodi). Il vantaggio principale del ragionamento probabilistico rispetto a quello logico sta nella possibilità di giungere a descrizioni razionali anche quando non vi è abbastanza informazione di tipo deterministico sul funzionamento del sistema.

Page 4: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

• Le reti bayesiane possono essere utilizzate in ogni settore in cui sia necessario modellare la realtà in situazioni di incertezza, cioè in cui siano coinvolte delle probabilità.

Page 5: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

La regola di Bayes

Spesso, nei ragionamenti probabilistici, capita che si debba valutare una probabilità avendo già delle informazioni su quanto è già accaduto in precedenza. Dati due eventi A e B, se questi sono in qualche modo correlati, è ragionevole pensare che il sapere che uno dei due è già avvenuto possa migliorare la conoscenza della probabilità dell'altro.

Page 6: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

Dato uno spazio di probabilità (,A, P[.]), dove : spazio campionario (insieme di tutti i

possibili risultati dell'esperimento)A: spazio degli eventi (contenente )P[.]: funzione di probabilità con Dominio in A e

Codominio in [0,1]dati due eventi A e B appartenenti ad A,

indichiamo con                                 P[A|B] la probabilità che si verifichi A sapendo che si

è già verificato B, cioè la probabilità di A condizionata a B.

Page 7: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

Regola di Bayes

• P[A|B] = P[A,B] / P[B] (per P[B]≠0), dove P[A,B]=P[B|A] P[A]

• Forma completa:• dato lo spazio di probabilità ( , A, P[.]), siano

B1,B2,...Bn appartenenti ad A;

• per ogni i P[Bi]>0; i≠i BiBj=0; =UiBi; allora per

ogni A appartenente ad A

• P[Bk|A] = P[A|Bk] P[Bk] / ( i P[A|Bi] P[Bi] )

Page 8: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

• Supponiamo che viviate a Londra e che abbiate notato che in inverno piove (P) il 50% (p(P)) delle volte ed è nuvoloso (N) l’80% (p(N)) delle volte (talvolta è nuvoloso ma non piove).

• D’altra parte, il 100% delle volte in cui piove è anche nuvoloso (p(N|P)).

• Qual è la probabilità che oggi piova essendo nuvoloso (p(P|N))?

• La regola di Bayes ci può aiutare in questo, infatti

   p(P|N) = p(P)p(N|P)/p(N) = 0.5 x 1.0 / 0.8 = 0.625 = 5/8. Quindi 5/8 delle volte a Londra, quando è nuvoloso, piove.

Page 9: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

Le reti Bayesiane

• Si usa una struttura di dati chiamata rete bayesiana (o rete di credenze)  per rappresentare la dipendenza fra le variabili e per dare una specifica concisa della distribuzione di probabilità congiunta.

Page 10: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

Una rete Bayesiana è un grafo in cui valgono le seguenti proprietà: 

• 1)      Un insieme di variabili casuali costituiscono i nodi della rete;   

• 2)      Un insieme di archi con verso connette le coppie di nodi (Il significato intuitivo di una freccia dal nodo X al nodo Y è che X ha un’influenza diretta su Y);

Page 11: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

• 3)      Ogni nodo ha una tabella delle probabilità condizionate che quantifica gli effetti che i “genitori” hanno sul nodo, dove per “genitori” si intendono tutti quei nodi che hanno frecce che puntano al nodo;

• 4)      Il grafo non ha cicli diretti;  

Page 12: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

• Un nodo che non ha genitori diretti (cioè non ha frecce che puntano verso di lui) contiene una tabella di probabilità marginali.

• Se il nodo è discreto contiene una distribuzione di probabilità sugli stati della variabile che rappresenta.

• Se il nodo è continuo contiene una funzione gaussiana di densità (definita da media e varianza) della variabile casuale che rappresenta.

Page 13: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

• Se un nodo ha parenti (cioè uno o più frecce che puntano verso di lui) allora il nodo contiene una tabella di probabilità condizionate.

• Se il nodo è discreto la funzione di probabilità condizionata contiene la probabilità condizionata del nodo data una configurazione dei suoi parenti.

• Se il nodo è continuo, la funzione di probabilità condizionata contiene media e varianza di ogni configurazione degli stati dei suoi nodi parenti.

Page 14: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

Esempio 1: Gestione del traffico

Un Comune può decidere se bloccare o no le auto per una giornata nel caso in cui si verifichi uno dei seguenti casi: 

• viene raggiunto il livello massimo di inquinamento, 

• si verifica una congestione delle strade.  A seconda della situazione i cittadini dovranno decidere se spostarsi con i mezzi pubblici o prendere la macchina.

Page 15: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

Page 16: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

• Una volta che la topologia della rete è specificata dobbiamo solo specificare le probabilità condizionate per i nodi che partecipano nelle dipendenze dirette, usando queste per il calcolo di qualunque altro valore di probabilità. Ogni nodo è caratterizzato da una tabella delle probabilità condizionate. Ogni riga della tabella contiene la probabilità condizionata del valore di ogni nodo per un caso condizionante.

Page 17: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

Esempio 2: L’albero di Jack

• Un giorno Jack si accorge che il suo albero di mele perde le foglie.

• Jack sa che se l’albero è secco allora è normale che perda le foglie.

• Ma Jack sa anche che la perdita delle foglie può essere sintomo di malattia per il suo albero.

Page 18: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

La rete per l’albero di Jack

La rete consiste di 3 nodi: • Malato, Secco, e Perde le foglie • Malato può essere “malato" o "no" • Secco può essere “secco" o "no" • Perde le foglie può essere “si" o "no".

malato secco

perde le foglie

Page 19: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

• La dipendenza casuale è tra Malato e Perde le foglie e Secco e Perde le foglie.

• Ad ogni nodo è associata una tabella di probabilità, che possono essere a priori o condizionate. Ad esempio:

• P(Malato=“malato“)=0.1• P(Malato="no“)=0.9• P(Secco=“secco“)=0.1• P(Secco="no“)=0.9

Page 20: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

Secco=“secco” Secco=“No”

Perde=“si”

Perde=“no”

Malato=

“Malato”

Malato=

“No”

Malato=

“Malato”

Malato=

“No”

0.95 0.85

0.05 0.15

0.90 0.02

0.10 0.98

P(Perde le foglie | Malato, Secco)

Page 21: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

Esempio 3: Diagnosi di un paziente che arriva in clinica

Supponiamo di avere di fronte un nuovo paziente, di cui non sappiamo niente. Una volta che avremo acquisito informazione specifica su di lui la nostra rete bayesiana riguardante il suo stato di salute potrà essere aggiornato, fornendo risultati più attendibili.

Page 22: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

Diagnosi di una malattia polmonare

Page 23: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

I dati

• Statisticamente, in un campione rappresentativo di popolazione si conoscono i seguenti dati.

• Il 50% dei pazienti fuma.

• Il 1% ha la tubercolosi.

• Il 5.5% ha un cancro al polmone ().

• Il 45% ha una qualche forma di bronchite.

Page 24: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

Come si procede

Si costruisce la rete bayesiana e si analizzano i sintomi mostrati dal paziente. Ad esempio, supponiamo che:

• Il paziente lamenta dispnea.

• Il paziente è stato recentemente in Asia.

• Il paziente è un fumatore.

Page 25: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

Inoltre

• Si effettua una radiografia da cui si vede che:• 1. Risultato negativo

Sembra che la diagnosi migliore sia che il paziente ha una semplice bronchite.

• 2. Risultato positivo• La probabilità di un cancro o della tubercolosi

sono aumentate enormemente. E’ comunque necessario effettuare nuovi esami.

Page 26: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

Reti Bayesiane Statiche

Page 27: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

Reti Bayesiane Dinamiche

Page 28: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

Esempio 4: Il pozzo di petrolio

• Un agente deve decidere se perforare o non perforare per trovare un pozzo di petrolio. E’ incerto se il punto in cui vuole perforare sia secco (dry), umido (wet) o pieno (soaking). L’agente puo’ effettuare una ricerca geologica che puo’ aiutarlo a determinare la struttura geologica del sito. La risposta dell’indagine puo’ essere: molto petrolio (closed), poco petrolio (open) o vuoto (diffuse).

Page 29: Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008 Sistemi di Supporto alle Decisioni I Lezione 7 Chiara Mocenni Corso di laurea L1.

Chiara Mocenni - Sistemi di Supporto alle Decisioni I – aa. 2007-2008

• Le decisioni sono 2:

• 1. Fare il test geologico (costo: 10 K$);

• 2. Perforare (costo: 70 K$).

• L’utilita’ della perforazione e’ determinata dal risultato: dry, wet o soaking.