Strumenti di supporto alle decisioni Alessandro Mazzetti.

35
Strumenti di supporto alle decisioni Alessandro Mazzetti

Transcript of Strumenti di supporto alle decisioni Alessandro Mazzetti.

Page 1: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Strumenti disupporto alle decisioni

Alessandro Mazzetti

Page 2: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Definizione

Strumento che aiuti l’uomo nel prendere decisioni

• analisi di scenari• simulazione di evoluzione• planning• valutazione del rischio• teoria dei giochi• analisi multivariate ed econometriche• analisi break-even• alberi decisionali

Page 3: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Per decidere bisogna conoscere

Page 4: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Generazione della conoscenza

• Business Intelligence– ricerca di conoscenza utile e fruibile

• Data Mining– investigazione di dati per trarne conoscenza– scoperta di informazioni inattese

• Machine Learning (apprendimento autom.)– generazione automatica di conoscenza

Page 5: Strumenti di supporto alle decisioni Alessandro Mazzetti.

"Pierino, sei una bestia! Non hai capito niente della Rivoluzione Francese!".

"Eppure avevo imparato a memoria tutto il capitolo del libro...".

"Non serve. Hai fatto un lavoro inutile: dovevi capire, non imparare a memoria!".

Page 6: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Apprendimento

• Capire Imparare a Memoria

• Capire =– collegare– notare– generalizzare

Page 7: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Tipi di apprendimento

• per spiegazione– il discente può comunicare col docente– il discente deve avere una conoscenza pre-esistente

• da esempi– il discente non ha la conoscenza necessaria per

comunicare col docente– quello che avviene nei neonati

(imparare a camminare, a parlare, a riconoscere,…)

Page 8: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Apprendimento da esempi = generalizzazione

• la palla va giù

• il biberon va giù RICORDARE

• l’acqua va giù

Gli oggetti cadono CAPIRE

Page 9: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Esempio

Osservare partite a carte

Trarne le regole del gioco

Page 10: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Due forme di conoscenza

• “Imparare a memoria” casi specifici– occupa tanta memoria– copre solo i casi enumerati

• la palla cade, la penna cade, la forchetta cade,…

• il termosifone cade ?

• Generalizzare– forma compatta– copre anche casi mai visti

• TUTTI gli oggetti cadono (anche i termosifoni)

Page 11: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Conoscenza indotta• ieri il sole è tramontato ad ovest

• anche l’altroieri

• anche settimana scorsa

• anche l’anno scorso

Il sole tramonta SEMPRE ad ovest

Quindi anche domani !

Page 12: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Difficoltà

• È molto difficile generalizzare correttamente– tutti gli italiani mangiano la pizza– tutti gli uomini sono traditori– le bionde sono belle

• Una buona generalizzazione deve essere:– completa (coprire tutti gli esempi positivi)– consistente (escludere tutti gli esempi negativi)– significativa (classificare correttamente gli

esempi non visti)

Page 13: Strumenti di supporto alle decisioni Alessandro Mazzetti.

• DEDUZIONE (Aristotele IV secolo a.C.)

IF A THEN B deduzione (de-duco=portare fuori) A vero implica B vero A falso non implica nulla

• INDUZIONE (Hume XVI secolo d.C.)

A vero B vero A falso B falso A vero B vero A falso B vero induzione (in-duco=portare dentro) IF A THEN B (ma non ne sono sicuro)

Inferenza e apprendimento

Page 14: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Proprietà dell’induzione

• La deduzione preserva la verità– data una conoscenza generale corretta, ottengo

un’informazione particolare corretta

• L’induzione preserva la falsità– non bastano miliardi di esempi a verificare una

regola– basta un solo controesempio a falsificare una

regola

Page 15: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Preservazione della falsità

• Ferrari: rossa veloce• Lamborghini: rossa veloce• Topolino: blu lenta• Porche: nera veloce

Le auto rosse sono veloci (può darsi)

• Panda: rossa lenta

Rosso NON implica veloce (DI SICURO)

Page 16: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Apprendimento da esempi

• apprendimento supervisionato– esiste un maestro che conosce il concetto da

apprendere (ma non lo spiega)– generazione di conoscenza che soddisfi il

comportamento del maestro

• apprendimento non supervisionato– scoperta da osservazioni– generazione di conoscenza del tutto autonoma,

notando somiglianze, correlazioni, regolarità

Page 17: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Esempi di apprendimento supervisionato

• Leggi fisiche– maestro = Natura

• Relazioni sociali– maestro = esperienze

• Operazioni finanziarie– maestro = andamento della Borsa

Page 18: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Esempi di apprendimentonon supervisionato

• Categorizzare le persone– le donne sono più intuitive degli uomini– i Capricorni sono cocciuti

• Notare differenze all’estero– in Francia non si usa il bidet– gli inglesi fanno la coda uno ad uno

• Correlare attributi– le piccole cooperative sono tipiche del nord– gli uomini che comprano pannolini,

comprano anche alcoolici

Page 19: Strumenti di supporto alle decisioni Alessandro Mazzetti.

…in termini più tecnici...

• Apprendimento supervisionato:– è noto l’attributo da apprendere– al conoscenza appresa è una regola

statura capelli occhi aspetto basso biondi blu belloalto biondi scuri bruttoalto rossi blu bellobasso scuri blu bruttoalto scuri blu bruttoalto biondi blu belloalto scuri scuri bruttobasso biondi scuri brutto

Concetto da apprendere

se capelli=rossi allora aspetto=bellose capelli=scuri allora aspetto=brutto

Page 20: Strumenti di supporto alle decisioni Alessandro Mazzetti.

…in termini più tecnici...

• Apprendimento NON-supervisionato:– non è noto l’attributo da apprendere– al conoscenza appresa è una tassonomia

statura capelli occhi aspetto basso biondi blu belloalto biondi scuri bruttoalto rossi blu bellobasso scuri blu bruttoalto scuri blu brutto si assomiglianoalto biondi blu bello (alto, occhi-blu)alto scuri scuri bruttobasso biondi scuri brutto

Esiste la categoria degli alti cogli occhi blu

Page 21: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Cosa c’è alla base

• Una grande quantità di dati

• raccolti per altri motivi

• organizzati in maniera adeguata

DATA WAREHOUSE

Page 22: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Generazione di alberi decisionali• ID3 (Iterative Dichotomizer)

– Ross Quinlan (1982)

• derivato da CLS (Concept Learning System)– Hunt (1966)

• Input = tabella• Output = procedura decisionale rappresentabile come:

– regole– albero– procedura

Page 23: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Albero generato da ID3

statura capelli occhi aspetto

basso biondi blu bello

alto biondi scuri brutto

alto rossi blu bello

basso scuri blu brutto

alto scuri blu brutto

alto biondi blu bello

alto scuri scuri brutto

basso biondi scuri brutto

Page 24: Strumenti di supporto alle decisioni Alessandro Mazzetti.

L’idea base di ID3

• cercare l'attributo piu' simile al concetto da apprendere (cioe' la colonna "bellezza")

• considerare la frequenza di ogni valore possibile ("alto", "basso",...)

• scegliere l’attributo che discrimina meglio

• ripartire daccapo considerando la sotto-tabella rimanente

• finché ottengo una sotto-tabella vuota

Page 25: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Teoria dell’informazione di Shannon

• su 8 esempi, 3 sono di belli e 5 di brutti

-3/8 log 3/8 - 5/8 log 5/8 = 0.954 bit 2 2

• quindi ho un'informazione di 0.954 bits

• Quanto conta la statura?– media pesata degli alti belli rispetto ai brutti belli

5/8 * 0.971 + 3/8 * 0.918 = 0.951 bit

• L’attributo che conta di più è “capelli”

• Si genera il nodo “capelli” e si riparte

Page 26: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Esercizio

• Visitare http://www.planasia.it/DemoMine.html

• definire interattivamente il concetto da far apprendere

• analizzare le tre forme di conoscenza generata

• Riuscite a generare la regola “sei malato se hai la febbre oppure se starnutisci” ?

Page 27: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Apprendimento non-supervisionato

• sistema in grado di creare tassonomie a partire da un insieme di dati "sciolti"

• vengono notate le similarita’ fra i dati

• viene scoperta l'esistenza di categorie

• si forma una partizione (clustering) dei dati

• i dati appartenenti alla stessa classe si assomigliano fra di loro

Page 28: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Tassonomia

Page 29: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Apprendimento incrementale

Page 30: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Progetti storici

• "Cluster" (R. Michalski, 1983),

• "Unimem" (M. Lebowitz, 1986),

• "Cobweb" (D. Fisher, 1987)

• approfondiamo Unimem

Page 31: Strumenti di supporto alle decisioni Alessandro Mazzetti.

L’input è una tabella “disordinata”fiat_tipo cc1600, abbordabile, posti(5), porte(5), consumo(medio)renault_clio economica, corta, cc1200, posti(5), porte(3), consumo(basso)jeep non_veloce, cc2000, alta, porte(5), cara, consumo(alto)subaru_legacy lunga, cara, veloce, cc2000, posti(5), consumo(medio), vol2renault_19 abbordabile, cc1400, posti(5), porte(5), consumo(medio)toyota_4x4 cara, non_veloce, cc2500, alta, porte(5), consumo(alto)citroen_zx abbordabile, cc1600, posti(5), porte(5), consumo(medio)opel_omegaSW cara, veloce, lunga, cc2000, posti(5), consumo(medio), vol2rolls_royce carissima, lunga, vol3, posti(5), porte(4), consumo(alto)peugeot_205 corta, cc1000, posti(5), economica, porte(3), consumo(basso)range_rover cara, alta, cc2500, posti(6), porte(5), consumo(alto)vw_golf abbordabile, cc1600, posti(5), porte(5), consumo(medio)fiat_uno economica, cc1100, posti(5), porte(3), consumo(basso)porshe carissima, velocissima, cc3600, posti(2), porte(2), consumo(alto)fiat_tempra_SW lunga, cara, veloce, cc1800, consumo(medio), vol2renault_nevada cara, veloce, cc2000, posti(7), consumo(medio), lunga, vol2mercedes_500 carissima, vol3, cc5000, posti(5), porte(4), consumo(alto)ferrari carissima, velocissima, cc5000, posti(2), porte(2), consumo(alto)

Page 32: Strumenti di supporto alle decisioni Alessandro Mazzetti.

radice [ ] range_rover renault_nevada classe_a [abbordabile,posti(5),porte(5),consumo(medio)] renault_19 /* e' una 1400 cc */ classe_c [cc1600] fiat_tipo citroen_zx vw_golf classe_b [cara,non_veloce,alta,porte(5),consumo(alto)] jeep toyota_4x4 classe_d [cara,veloce,lunga,cc2000,posti(5),consumo(medio),vol2] subaru_legacy opel_omegaSW fiat_tempra_SW classe_e [corta,posti(5),economica,porte(3),consumo(basso)] renault_clio peugeot_205 fiat_uno classe_f [carissima,vol3,posti(5),porte(4),consumo(alto)] rolls_royce mercedes_500 classe_g [carissima,velocissima,posti(2),porte(2),consumo(alto)] porshe ferrari

Cos’ha scoperto ?

Page 33: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Cos’ha scoperto ? I tipi di auto !

radice [ ] range_rover renault_nevada /* non classificate */ classe_a [abbordabile,posti(5),porte(5),consumo(medio)] renault_19 /* e' una 1400 cc */ /* berline */ classe_c [cc1600] fiat_tipo citroen_zx vw_golf classe_b [cara,non_veloce,alta,porte(5),consumo(alto)] jeep toyota_4x4 /* fuoristrada */ classe_d [cara,veloce,lunga,cc2000,posti(5),consumo(medio),vol2] subaru_legacy opel_omegaSW fiat_tempra_SW /* familiari */ classe_e [corta,posti(5),economica,porte(3),consumo(basso)] renault_clio peugeot_205 fiat_uno /* utilitarie */ classe_f [carissima,vol3,posti(5),porte(4),consumo(alto)] rolls_royce mercedes_500 /* lussuose */ classe_g [carissima,velocissima,posti(2),porte(2),consumo(alto)] porshe ferrari /* sportive */

Page 34: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Metrica

• È alla base dell’apprendimento non-supervisionato

• misura quanto si assomigliano due casi

• metrica forte– [a,b,c,d] assomiglia ad [x,d,c,b] ma non a [d,b]

• metrica debole– [a,b,c,d] assomiglia ad [x,d,y,b] ma non a [b]

Page 35: Strumenti di supporto alle decisioni Alessandro Mazzetti.

Conclusioni

• Apprendimento = generazione di conoscenza

• Utile per supportare le decisioni

• Campi d’applicazione– segmentazione del mercato (supermarket, banche,…)– investigazione di frodi (clonazione cellulari,…)– manutenzione preventiva (guast frequenti,…)– valutazione del rischio (ambientale, finanziario,…)– previsione di consumo (energetico, beni,…)