Elementi di teoria della probabilità e distribuzioni di probabilità
-
Upload
marino-palmisano -
Category
Documents
-
view
240 -
download
1
Transcript of Elementi di teoria della probabilità e distribuzioni di probabilità
Elementi di teoria della probabilità e distribuzioni di probabilità
Eventi aleatori
• Un evento è aleatorio (casuale) quando non si può prevedere con certezza se avverrà o meno
• I fenomeni (eventi) aleatori sono studiati attraverso la teoria della probabilità
Probabilità di un evento semplice
Un evento può risultare:
• Certo (si verifica sempre)
-estrazione di una pallina nera da un’urna contenente solo palline nere
• Impossibile(non si verifica mai)
-estrazione di una pallina bianca da un’urna contenente solo palline nere
• Probabile(può verificarsi o no)
-estrazione di una pallina bianca da un’una contenente sia palline nere che bianche
Eventi e probabilità
impossibile
probabile
certo
P=0 0<P<1 P=1
Se E indica un evento l’evento corrispondente al non verificarsi di Erappresenta l’evento complementare E con la relazione
P(E) = 1 – P(E)
La prova genera l’evento con una certa probabilità
Eventi aleatori
• Evento semplice singola manifestazione di un fenomeno
(misura,osservazione, risultato) che esclude altri eventi
(eventi incompatibili: testa o croce nel lancio di una
moneta)
• Evento composto è costituito da una combinazione di più eventi semplici.
Possono verificarsi simultaneamente ovvero sono
compatibili(l’evento testa di una moneta è compatibile con
l’evento croce nel lancio di due monete)
Eventi aleatori
• L’insieme di tutti gli eventi di un fenomeno costituiscono l’universo o spazio campione (Ω) delle possibilità.
• Si usa il termine successo per segnalare che si è verificato l’evento considerato e insuccesso in caso contrario. Essi sono eventi incompatibili o mutuamente esclusivi
Eventi necessari ed eventi incompatibili
• Due eventi A e B si dicono incompatibili se non possono verificarsi entrambi nella stessa prova
Se A è l’evento “carta di cuori” e B l’evento “carta di picche”, i due eventi sono incompatibili perché nessuna carta può essere contemporaneamente “cuori” e “picche”
• Due eventi si dicono necessari se almeno uno dei due si presenta in una prova
Nel lancio di una moneta i due eventi T e C sono necessari perché almeno uno si presenta
-necessari ed incompatibili:numero pari e numero dispari
-necessari ma non incompatibili: un numero >3 e un numero <5 (il 4 è in comune)
-incompatibili ma non necessari: l’uscita del numero 2 e del numero 6
Spazio campionario
• Lo spazio campionario associato al lancio di due monete comprende 4 punti che rappresentano i possibili risultati
• Si chiama evento ogni sottoinsieme dello spazio campionario
•TT•TC•CT•CC
Cenni di insiemistica
• Un insieme (A,B,C,..) può essere definito come un gruppo di una qualsiasi specie di elementi (a,b,c,...)
• È ben definito quando è evidente che un elemento appartiene o no all’insieme stesso e in base al loro numero si fa riferimento a: insieme finito o infinito
• Quando tutti gli elementi di un insieme B fanno anche parte degli elementi di A, si definisce B sottoinsieme
Ø Insieme vuoto
a A l’elemento a appartiene a un insieme A
B A
B è contenuto in A
Ogni insieme è sottoinsieme di un
Insieme più generale detto
universo o spazio campionario Ω
Rappresentazione grafica sottoinsieme
Ω
AB
B A Ω
Es:risultati del lancio di un datoA = esce 2 A = esce pari A = 1/6 A = 3/6 = 1/2
Evento complementare
Es: i risultati del lancio di un dado
A = esce 2
A = non esce 2
L’evento complementare di A
è l’evento che
comprende tutti i casi in cui A
non si verifica
p = (A) = 1- p(A)
p(A) = 1/6
p(A) = 5/6
A
A
A
Intersezione
Insiemi disgiunti A esce 2 B esce 3 A ∩ B = Φ insieme vuoto evento impossibile
A ∩ B insiemi che si intersecano A esce numero pari B esce ≤ 3 A ∩ B = esce 2
l’intersezione di due eventi A e B
comprende tutti i casi in cui si verificano sia A che B
AB
A B
Unione
A e B insiemi disgiunti
A esce 2 B esce 3
A U B esce 2 oppure 3
p(A U B) = p(A) + p(B)
Es: i risultati del lancio del dado
pari = 2 o 4 o 6
p(pari) = p(2)+p(4)+p(6)
= 1/6 + 1/6 + 1/6 = 3/6 = 1/2
B
A
Unione
A e B due insiemi che si intersecano
l’unione di A e B comprende tutti i casi
in cui si verifica A oppure B e tutti i casi
in cui si verificano entrambi
(intersezione)
A esce pari B esce un numero ≤ 3
A∩B = esce 2
A U B = esce “1” oppure
2” oppure “3” oppure “4” oppure “6”
p(A U B) = p(A) + p(B) – p(A ∩ B)
B A
Teoria e calcolo della probabilità
• L’entità di successi in una serie di osservazioni (prove) può essere definita come frequenza relativa o
(percentuale) calcolata come rapporto tra il numero di eventi favorevoli rispetto al numero di
casi esaminati • Il grado di aspettativa circa il
verificarsi di un evento E, ovvero la probabilità dell’evento P(E) è possibili casi di numero
successi di numero)( EP
Concezione classica della probabilità
La probabilità di un evento E è il rapporto tra il numero di casi favorevoli al verificarsi di E(n) e il numero di casi possibili (N), purché siano tutti equi - probabili
N
nP(E)
Es:
•probabilità di estrarre un asso da un mazzo di 52 carte = 4/52 = 0.08
•probabilità di ottenere testa nel lancio di una moneta =1/2 = 0.5
Applicazioni della concezione classica
• Probabilità uscita testa
• Probabilità faccia 6 dado
• Qual è la probabilità che lanciando due volte una moneta si presenti prima la faccia testa poi la faccia croce
1°- TT2°- TC
3°- CT4°- CC
p =
p=
p =
2
1
6
1
4
1
Concezione frequentista della probabilità
• La probabilità di un evento è la frequenza relativa di successo in una serie di prove tendenti all’infinito, ripetute sotto identiche condizioni
• Nella concezione frequentista la probabilità è ricavata
a posteriori dall’esame dei dati
N
nN
limP(E)
Frequenza relativa su ungran numero di prove
Es: qual è la probabilità post-operatoria dopo l’intervento xyz ?I dati su un decennio in un territorio presentano 30 morti su 933 interventiFrequenza relativa = 30/933= 3.22% = Probabilità di mortalità post-operatoria
Legge dei grandi numeri
• P(E): ripetendo la prova un gran numero di volte si osserva che il rapporto f= m/n (frequenza relativa) dove m= numero di successi ed n= numero di prove tende ad avvicinarsi sempre più alla probabilità P(E)
La frequenza relativa f al crescere del numero delle prove, tende, pur oscillando, verso un valore
costante (regolarità statistica)
Concezione soggettivistica
Critiche alla concezione frequentista:• Non sempre è possibile ripetere lo stesso esperimento
nelle medesime condizioni• È impossibile l’analisi probabilistica di fenomeni non
ancora osservati
Concezione soggettivista:la probabilità P(E) di un evento è un valore che traduce numericamente un’opinione personaleE’ la quantificazione della misura della fiducia che vieneassegnata al manifestarsi dell’evento
Teorie della probabilità
gravidanza 1 su 2 = 50% (definizione classica di probabilità) (probabilità a priori )
maschio femmina
Nel mondo, in assenza di interventi dell’uomo nascono 1057 maschi ogni 1000 femmine 1000/(1000 + 1057) = 48.6% (definizione frequentista di probabilità) (probabilità a posteriori)
L’ ecografista, alla decima settimana di gravidanza, dice ai genitori che80 su 100 il neonato è femmina (definizione soggettivista di probabilità)
Assiomi della teoria della probabilità
• Ad ogni evento di uno spazio campione è associato un numero, da 0 a 1, detto probabilità dell’evento
• La probabilità 0 è associata all’evento impossibile, la probabilità 1 all’evento certo
• Dati due eventi mutuamente esclusivi E1 e E2 e le rispettive probabilità P1 e P2, la probabilità dell’evento unione E1 E2 sarà determinata da P(E1 E2 )= P1 + P2.
• La probabilità, principio della somma, può essere generalizzata a N eventi incompatibili ed esaustivi, nel caso P1 + P2 +....Pn=1
Teorema delle probabilità totaliprincipio della somma
• La probabilità del verificarsi di due o più eventi tra loro incompatibili è la somma delle probabilità se il verificarsi di uno esclude il verificarsi dell’altro
p(E1 o E2) = p(E1) + (E2)
Probabilità eventi incompatibiliEsercizio
• Un urna contiene tre palline bianche, due nere e cinque rosse. Qual è la probabilità che estraendo una pallina a caso sia bianca o nera?
2
1
10
5
10
2
10
3p
Principio della somma
• Qual è la probabilità che un italiano a caso presenti un gruppo sanguigno di tipo 0 oppure A?
• Calcolare la probabilità dell’insieme unione (0 A)
• Si attribuisce a ogni gruppo sanguigno una probabilità
A = 0.40; B = 0.10; AB = 0.04;0 = 0.46
In base al principio della somma:
P(A 0)= P(A) + P(0)=
=0.40 + 0.46 = 0.86 86%
La probabilità del verificarsi di due o più eventi tra loro incompatibili è la somma delle probabilità dei singoli eventi
Probabilità totalieventi incompatibili
P(A B)= P(A)+ P(B)-P(A B)• La probabilità della loro unione è tutta l’area compresa all’interno del
contorno(diagramma Venn);la somma delle due aree include due volte la probabilità della loro intersezione che va sottratta
• Avendo gli eventi una parte in comune facendo la somma delle probabilità associate ai due singoli eventi si conterebbe due volte la parte comune
• Evento A= estrazione di un Re Evento= B estrazione carta di fiori• P(A B)=P(KC KQ KF KP 1F 2F......KF)• La probabilità del verificarsi Kappa di Fiori (KF) è considerata due
volte per cui va sottratta: • P(A B)=P(KC)+P(KQ)+P(KF)+P(KP)+P(1F)+P(2F)+.......
...P(KF)-P(KF)= 4/52+13/52-1/52
• Il principio della probabilità totale può essere espresso come segue
P(A o B)=P(A)+P(B) – (PA e B)
in cui P(A e B) rappresenta la probabilità di ottenere
contemporaneamente sia A che B
• La probabilità di ottenere A o B può essere calcolata sommando prima la probabilità di ottenere A con la probabilità di ottenere B e sottraendo poi la probabilità di ottenere simultaneamente A e B
• Si deve sottrarre P(A e B) perché la probabilità che si verifichi questo evento congiunto è stata calcolata nella somma due volte in P(A) e una volta in P(B)
• Es: Probabilità di estrarre da un mazzo di carte una donna (A) e probabilità di estrarre dallo stesso mazzo una carta di picche(B)
P(A o B)=P(A)+P(B)-P(A e B)=4/52+13/52-1/52=16/52=4/13
Probabilità condizionata
La probabilità di un evento cambia in base informazioni che
abbiamo
Es: p( esce 2) = 1/6
Se conosco che “esce un numero pari” p = 1/3
Introduciamo quindi il concetto di probabilità condizionata:
p(A|B) = probabilità di A condizionata a B
Es: Nella popolazione generale, la probabilità di decesso per infarto è 5%;fra i fumatori è 10%.
p(decesso per infarto) = 0.05p(decesso per infarto|fumatore) = 0.10
Eventi dipendenti e indipendenti
• Quando la probabilità di un evento NON cambia in presenza di condizionamento ad un altro evento, essi si dicono indipendentip(A|B) = p(A)
Il condizionamento non agisce! L’aspettativa di A non si modifica sapendo che si verifica B
• A e B si dicono dipendenti se:p(A|B) ≠ p(A)
L’aspettativa di A si modifica sapendo che si verifica B
Principio del prodottoeventi indipendenti
• La probabilità di due eventi indipendenti E1 E2 (cioè il verificarsi congiuntamente dell’uno e dell’altro) è uguale al prodotto delle rispettive probabilità.
• Se gli eventi indipendenti sono k si ha:
P(E1) P(E2) ...... P(Ek)
Un evento E2 è indipendente da un evento E1 se il
verificarsi di E1 non altera la probabilità che E2 ha di
manifestarsi
Principio del prodotto eventi indipendenti
• Evento : estrazione asso di spade
Non sono eventi
mutuamente esclusivi A∩C = asso di spade
• Il concetto di intersezione indica sia contemporaneità di eventi ma si riferisce anche al verificarsi di eventi in tempi diversi
• Calcolo della probabilità di una intersezione
P(A∩C)= P(A) P(C)=
• Da un’urna contenente due palline nere(N) e una Bianca(B) si fanno due estrazioni di una pallina, con reimmissione. Qual è la probabilità di estrarre una pallina nera alla prima estrazione (N1) e una bianca alla seconda (B2)?
P(N1∩ B2)= (P(N1) P(B2)=
Probabilità indipendente
40
1
40
10
40
4
9
2
3
1
3
2
Distribuzioni di probabilità
• Una distribuzione di probabilità è formata dall’insieme di probabilità associate a tutti i possibili eventi casuali di uno spazio campione
• Si definisce variabile casuale (aleatoria) una variabile x che può assumere in un esperimento casuale, certi valori x1, x2,...,xn rispettivamente con probabilità p1, p2,...., pn
• L’insieme dei valori che la variabile può assumere e delle corrispondenti probabilità costituisce una distribuzione di probabilità
Variabile casuale e variabile statistica parallelismo e differenze
• La probabilità è un dato teorico determinato “a priori”
• La frequenza è un dato sperimentale derivante da prove o osservazioni fatte
• Una variabile casuale è originata da un esperimento casuale mentre la variabile statistica emerge dall’osservazione empirica dei fenomeni del reale
• Per le variabili casuali, in corrispondenza di ciascuna determinazione della variabile si considera la probabilità, mentre per le variabili statistiche si considera la frequenza relativa
Distribuzioni di probabilità variabili casuali continue
Distribuzioni di probabilità variabili casuali continue
• Le aree dei singoli rettangoli rappresentano le frequenze osservate delle modalità comprese tra gli estremi (X1, X2) degli intervalli di base
• Effettuata la rappresentazione analitica, all’area dei rettangoli si sostituisce l’area della superficie individuata dallo stesso intervallo di base e dal tratto di curva interpolata
• Questa area è la frequenza teorica delle modalità i cui valori sono compresi fra gli stessi estremi (X1, X2)
• A un rettangolo finito di base ΔX (ampiezza di classe) e di altezza Y(densità di frequenza relativa osservata), corrisponde un rettangolo infinitesimo di base dX e di altezza Y* (densità di frequenza relativa teorica)
Frequenza area di un rettangolo relativa osservata = finito
Frequenza area di un rettangolorelativa teorica = infinitesimo
Distribuzioni di probabilità variabili casuali continue
• La legge di probabilità di una v.c. è espressa da una funzione matematica p(x) detta funzione di densità di probabilità
• La probabilità in un evento casuale non è più un determinato valore della variabile casuale ma solo la probabilità che si abbia un valore della v.c. compreso in un intervallo x1 – x2 cioè
Pr(x1 ≤ x ≥ x2) = area individuata dalla curva (px) in corrispondenza degli estremi x1 e x2
• Per una v.c. continua x non è possibile elencare ed enumerare gli infiniti valori che essa può assumere
Variabili casuali continuedistribuzione di Gauss
• Se viene rilevata infinite volte le misure di una grandezza μ l’insieme di misure saranno +/- scostate dal valore vero di μ
• Si ipotizza che gli scarti (positivi e negativi) dal valore vero (x - μ) abbiano la stessa probabilità di verificarsi e gli scarti maggiori saranno i meno frequenti
Sono necessarie due informazioniIl valore vero della grandezza μ (la media del carattere)e la dispersione delle misureσ(deviazione standard)
2
)( 2
2
1)(
x
exP
Curva di Gauss
Caratteristiche• E’ simmetrica rispetto alla media:la probabilità di un valore
superiore alla media di una quantità prefissata è uguale alla probabilità di un valore inferiore per la stessa quantità
• L’area compresa tra la funzione e l’area delle ascisse
( da + a - ) sia = 1 così da esaurire lo spazio campionario
• Esiste la probabilità al 100% che la misura sia inclusa nella distribuzione
• La frazione di area compresa tra due valori della variabile è assimilabile alla probabilità di riscontrare casualmente una misura entro tale intervallo
Le aree sottese alla curva normale
• Spesso è necessario determinare la probabilità di riscontrare casualmente una misura entro tale intervallo
Proprietà della curva normale
l’area sottesa alla porzione di curva che vi è tra le media e una ordinata posta a una distanza data, determinata in termini di una o più deviazione
standard, è costante
Applicazione curva di Gauss
• Se una popolazione di unità classificate secondo un certo carattere X si distribuisce normalmente, la conoscenza di media e varianza (o loro stime) consente di calcolare (o di stimare) la frequenza relativa delle unità che presentano un valore di X compreso in un certo intervallo
• Calcolare la probabilità che, estraendo da tale popolazione un’unità questa abbia un valore di X compreso in un certo intervallo
Distribuzione gaussiana standardizzata
• Per agevolare il ricercatore la variabile x viene trasformata in una nuova variabile Z
• Mentre la distribuzione di X è normale con media X e DS s, quella della nuova variabile è normale con media 0 e DS 1
• La distribuzione standardizzata presenta il vantaggio di consentire la predisposizione di tabelle che permettono di calcolare porzioni di area della distribuzione e di stabilire la probabilità statistica di riscontrate valori in relazione a determinati valori Z
x
z
Valori notevoli della distribuzione z
z area compresa area esterna all’intervallo
nell’intervallo (- z + z) (code della distribuzione)
(-z + z)
1 (-1<z<+1) 0.683 (≈ 68%) 0.317 (≈ 32%)
1.96 (-1.96<z<+1.96) 0.95 (≈ 95%) 0.05 (≈ 5%)
2.58 (-2.58<z<+2.58) 0.99 (≈ 99%) 0.01 (≈ 1%)
Esempio di utilizzazione della distribuzione z
• Qual è la probabilità che un individuo estratto a caso da una popolazione con peso medio
72 Kg e deviazione standard
25 Kg pesi tra i 60 e 80 Kg:?
• Occorre calcolare la porzione di area compresa tra 60 e 80 Kg.
ai cui valori corrispondono rispettivamente i valori
48.025
)7260(60
Kg
Kgz
32.025
)7280(80
kg
kgz
Esempio di utilizzazione della distribuzione Z
• Facendo riferimento alla tabella z
per z=0.48 nelle due code è 0.631
• L’area di interesse tra -0.48 e 0 è 0.5 -
• Con analogo procedimento si calcola la porzione di area tra 0 e 0.32
P(60kg<peso<80kg=P(z60<z<z80) =
=P(-0.48<z<0) + (P(0<z<+0.32) =
=1-0.3155 - 0.3745=0.310 31,0%2
631.0
2
749.05.0
2
631.05.0
0 z
0,5
2
v
25,0
v
Ripartizione delle aree di probabilità della distribuzione z
Esempio di utilizzazione della distribuzione z
• Una popolazione di bambini presenta valori di statura distribuiti in modo gaussiano con media = 120 cm. e deviazione standard = 16 cm.
1. Quale è la probabilità che un bambino scelto a caso presenti una statura inferiore a 132 cm.?
2. Quale è la probabilità che l’altezza sia maggiore di 116 cm., ma inferiore a 132 cm.?
1R 75.016
)120132(132
cm
cmz
%4.777735.02265.01)2
453.05,0(5,0
Esempio di utilizzazione della distribuzione z
• 2R
• P(Z116<Z<Z132)0.7735-0.4015=0.3720 37.20%
25.016
)120116(116
cm
cmz
4015.02
803.0