DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

29
DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi

Transcript of DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Page 1: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

DISTIBUZIONE BINOMIALE

Probabilità di un numero limitato di successi

Page 2: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

variabile casuale di Bernoulli

• Supponiamo di fare un esperimento con appena 2 risultati possibili.

• Gli esempi comuni sono: – passare/fallire un esame– vincere/perdere al gioco– Osservare testa/croce lanciando una moneta– includere una persona in una lista [fumatori | non fumatori]– vivere/morire a causa di un ricovero in ospedale

• Si consideri una variabile casuale dicotomica.

• La variabile deve assumere uno di due possibili valori; questi risultati mutuamente esclusivi possono essere, ad esempio:

[maschio o femmina], [salute o malattia].

Per semplicità, vengono spesso indicati come

[“insuccesso” e “successo”].

• Una variabile di questo tipo è nota come

variabile casuale di Bernoulli.

Page 3: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

La distribuzione binomialeLa distribuzione binomiale {x} è la distribuzione di probabilità di una

variabile casuale discreta… tale che …

Il valore della variabile casuale sia il “numero di successi in una serie di esperimenti identici ed indipendenti”,

Se, per esempio,l’esperimento consiste nel lancio di una moneta.

Sia X = il numero di teste che deriva da una serie di n=10 lanci.

Allora la variabile casuale X segue una distribuzione binomiale.

La distribuzione binomiale più semplice deriva da un singola lancio di una moneta.

Un tale esperimento è denominato una “prova di Bernoulli” e la variabile casuale che corrisponde al numero di successi è denominata una variabile di Bernoulli.

Page 4: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Le prove di Bernoulli e la distribuzione binomiale

• Un esperimento che consiste di singolo lancio di una moneta, o una singola classificazione è denominato una prova di Bernoulli.

• Se l'esperimento (o prova) è ripetuto piò volte e le ripetizioni sono indipendenti tra loro, allora la distribuzione di probabilità della variabile casuale

• X= # dei successi in n prove indipendenti di Bernoulli è denominata “distribuzione binomiale”.

Page 5: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Una distribuzione è binomiale quando:

1. Il risultato di ogni prova è uno di 2 risultati, riferito spesso come un successo|fallimento.

2. La probabilità p di successo è la stessa in ogni prova.

3. Le prove sono indipendenti: il risultato di una prova non ha influenza sul risultato di un'altra prova.

Page 6: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Studiamo la distribuzione Studiamo la distribuzione binomialebinomiale

• La distribuzione binomiale è semplicemente una distribuzione discreta di probabilità.

• Possiamo studiare la distribuzione scrivendo i risultati possibili nello spazio dei campioni e determinando la loro probabilità. Cominciamo con un esempio semplice nel quale una moneta è gettata due volte.

• Poi studiamo la possibilità di gettare la moneta n=3 volte. Ciò induce a provare a generalizzare la probabilità di quale risultato avremmo se la moneta fosse lanciata n=4 volte, o persino di più volte.

Page 7: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Esempio 1

Assumiamo … di eseguire un esperimento che consiste nel lancio una

moneta n=2 volte e contare le teste {H}, che i lanci siano indipendenti. la moneta non sia viziata, che P(H)=0.5 = probabilità di una testa in un lancio.Rappresentiamo o il risultato di 2 lanci come {esito 1°lancio esito 2°lancio}.o lo Spazio dei Campioni: ({ HH }, { HT }, { TH }, { TT }).Per l’indipendenza: P({HH})=P(H nel 1°lancio)P(H nel 2°lancio) =0.25.Definiamo la variabile casuale X pari al numero di teste osservate. Allora:

X risultati P(X=x) P(X¡<=x) somma

0 {TT} 0,25 0,25

1 {HT, TH} 0,50 0,75.

2 {HH} 0,25 1,00.

Questa è una distribuzione binomiale con n=2, P=0.5. L'ultima colonna detta distribuzione cumulativa.

Page 8: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Esempio 2:

Un esperimento consiste nel selezionare due allievi di una classe

(n=2) ed osservare quanti di loro hanno ricevuto A in un esame.

Sia che il secondo allievo selezionato abbia o non abbia ricevuto A

questo evento non dipende dal risultato del il primo allievo (i

risultati sono indipendenti). Inoltre si supponga che la probabilità

di ricevere A sia P(A)=0.2.

Determiniamo la distribuzione binomiale per il numero di A ?.

Rappresentiamo il risultato delle due selezioni come {1° alunno, 2°

alunno }.

Rappresentiamo il grado A con la lettera A ed il “not A” con la

lettera B

Page 9: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

.

Esempio 2

Spazio dei campioni: ({AA}, {AB}, {BA}, {BB}). Poichè i lanci sono indipendenti :

P({AA}) = P(A 1° alunno ) P(A 2° alunno) = 0.04.

P({AB}) = P(A 1° alunno ) P(B 2° alunno) = 0.16.

P({BA}) = P(B 1° alunno ) P(A 2° alunno) = 0.16.

P({BB}) = P(B 1° alunno ) P(B 2° alunno) = 0.64.

Definiamo una variabile casuale X pari alllo score A osservato. Allora:

Evento.

x Risultati P(X=x) P(X¡x).

0 {BB} 0.64 0.64.

1 {AB, BA} 0.32 0.96.

2 {AA} 0.04 1.00.

Page 10: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Esempio 3

Un esperimento consiste nel selezionare a caso n=3 annotazioni in un pronto soccorso d'ospedale e vedere se il paziente ha una polizza di assicurazione contro le malattie.

Poniamo che le selezioni siano prove di Bernoulli con la probabilità P=0.6 di avere una polizza di assicurazione contro le malattie. Q=0.4 = probabilità che un paziente non abbia assicurazione contro le malattie. Rappresentiamo il risultato delle tre selezioni come {1° risultato di selezione, 2° risultato di selezione, 3°risultato di selezione }.

In fine, sia:

X= numero di pazienti con polizza di assicurazione, e rappresentiamo gli eventi:

Y= il paziente con polizza di assicurazione.

N= il paziente senza polizza di assicurazione.

Page 11: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Distribuzione Binomiale di XPoiché le prove sono indipendenti :P(YYY)=P(Y) P(Y) P(Y) =PPP=(0.6)(0.6)(0.6)=0.216P(YYN)=P(Y) P(Y) P(N) =PPQ=(0.6)(0.6)(0.4)=0.144P(YNY)=P(Y) P(N) P(Y) =PQP=(0.6)(0.4)(0.6)=0.144P(NYY)=P(N) P(Y) P(Y) =QPP=(0.4)(0.6)(0.6)=0.144P(YNN)=P(Y) P(N) P(N) =PQQ=(0.6)(0.4)(0.4)=0.096 etc.Lista di tutti i possibli pz , e, Prob(#pz con polizza). x Risultato P(X=x) 0 {NNN} 0.064 1 {YNN} 0.096 1 {NYN} 0.096 1 {NNY} 0.096 2 {YYN} 0.144 2 {YNY} 0.144 2 {NYY} 0.144 3 {YYY} 0.216x Risultato P(X=x) P(X¡x)0 {NNN} 0.064 0.0641 {YNN},{NYN},{NNY} 3(0.096)=0.288 0.3522 {YYN},{YNY},{NYY} 3(0.144)=0.432 0.7843 {YYY} 0.216 1.000

Page 12: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Esempio 4a.

Supponiamo che una “NEVICATA” capiti prima del 10 settembre circa una volta ogni 10 anni.

Durante i prossimi 5 anni, quante volte si verifi- cherà una NEVICATA prima del 10 settembre ?

Sia X = # di annate con una NEVICATA durante prossimi 5 anni.

Assumiamo per X una Distribuzione Binomiale, con n=5, P=0.10, Q=0.9.

Qual è la distribuzione di X?

Possiamo generalizzare i risultati?

(Sia Y= NEVICATA, N= NEVICATA assente.).

Ci sono due fattori che agiscono sulle probabilità.

A. Un fattore è la probabilità del risultato.

B. L'altro fattore è il numero di possibili risultati differenti.

Page 13: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Esempio 4a.

A. La probabilità dei risultati :{YNYNN} allora X=2, P(YNYNN)=PQPQQ=(PP)(QQQ)= P2Q3

{NNYYN} allora X=2, P(NNYYN)=QQPPQ=(PP)(QQQ))= P2Q3

In generale, con n prove, la probabilità di un risultato è : Px Q(n-x)=Px (1-P)(n-x)

B. Quanti risultati differenti possono verificarsi? Ogni tipo di evento x può accadere … un numero di volte = nCx

!

!( )!

n x

n nC

x x n x

Combinando queste idee, la distribuzione binomiale è Combinando queste idee, la distribuzione binomiale è data dadata da

( ) ( )!( ) { (1 ) } ( ) { (1 ) }

!( )!x n x x n x

n x

n nP X x C P P P P

x x n x

Page 14: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Teminologia

Notazione Fattoriale: N! si legge: N fattoriale ed è uguale a: N! = N(N-1)(N-2)(N-3)…(4)(3)(2)(1). Ad esempio, 3!=3(2)(1)=6.

Nota: Per definizione 0!=1.

!( )

!( )!n x

n nC

x x n x

, dove ci sono x oggetti di un tipo fra gli n oggetti del gruppo.

Permutazione: Il numero di modi differenti nei quali n oggetti di un gruppo possono essere ordinati. Questo numero è uguale a “n fattoriale”, n!.

Notazione per la Combinazione: Il numero di combinazioni costituite da due gruppi di oggetti è rappresentato come:

Combinazioni: Il numero di modi differenti nei quali gli oggetti di un gruppo possono essere ordinati, ignorando l'ordinamento degli oggetti nel gruppo.

Page 15: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Esempio 1a: Supponiamo che ci siano 4 sedie nella prima fila in un'aula. Quattro allievi entrano nell’aula e ciascuno si siede in una

delle sedie. In quanti modi differenti possono sedere gli allievi nelle sedie? Questo numero è il numero di permutazioni. Riferiamo gli allievi come: A, B, C e D ed elencano tutte le permutazioni.

numero 1 2 3 4 # 1 2 3 4 # 1 2 3 4

1 A B C D 9 B C A D 17 C C A B

2 A B D C 10 B C D A 18 C C B A

3 A C B D 11 B D A C 19 D D A C

4 A C D B 12 B D C A 20 D D C A

5 A D B C 13 C B A D 21 D C A B

6 A D C B 14 C B D A 22 D C B A

7 B A C D 15 C A B D 23 D B B C

8 B A D C 16 C A D B 24 D B C B

Ci sono 24 permutazioni, o ordinamenti. Per vedere come arrivare a questo numero si consideri il numero di persone differenti che possono sedere nella prima sedia, dopo avere eliminato quella persona, il numero di persone differenti che possono sedere nella sedia seguente, ecc. Così.

Permutazioni: 4! = 4 3 2 1 = 24

Sedie: 1 2 3 4

Page 16: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Esempio 4a.

Si suppone che una NEVICATA si presenti circa una volta prima del 10 settembre ogni 10 anni. Durante i 5 anni futuri, quante volte si verificherà una NEVICATA prima del 10 settembre? Sia X = # di annate con una NEVICATA durante prossimi 5 anni. Assumiamo per X una Distribuzione Binomiale, con n=5, P=0.10, Q=0.9.Qual è la distribuzione di X? (Sia Y= NEVICA , N= NON NEVICA.).Le probabilità binomiali sono date da …

( )!( ) { (1 ) }

!( )!x n xn

P X x P Px n x

0 5 55! 5!( 0) (0.1) (0.9) (0.9) 0.59049

0!(5 0)! 5!P X

1 4 1 45! 5!

( 1) (0.1) (0.9) (0.1) (0.9) 0.328051!(5 1)! 1!4!

P X

2 3 2 35! 5!( 2) (0.1) (0.9) (0.1) (0.9) 0.0729

2!(5 2)! 2!3!P X

3 2 3 25! 5!

( 3) (0.1) (0.9) (0.1) (0.9) 0.00813!(5 3)! 3!2!

P X

4 1 4 15! 5!( 4) (0.1) (0.9) (0.1) (0.9) 0.00045

4!(5 4)! 4!1!P X

5 0 55! 5!

( 5) (0.1) (0.9) (0.1) 0.000015!(5 0)! 5!

P X

# NEVICATA (X)P(x) P(X<=x)0 0.59049 0.590491 0.32805 0.918542 0.07290 0.991443 0.00810 0.999544 0.00045 0.999995 0.00001 1

Page 17: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

la fluttuazione casuale in un campione e la fluttuazione casuale in un campione e la distribuzione binomialela distribuzione binomiale

CAMPIONAMENTO DA UNA POPOLAZIONE CON

DISTRIBUZIONE BINOMIALE

Page 18: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

la fluttuazione casuale in un campione e la fluttuazione casuale in un campione e la distribuzione binomialela distribuzione binomiale

1- Quale caratteristica di una popolazione “in un campionamento” ci farà ipotizzare un modello binomiale?

2- Che cosa si può indurre in merito alla popolazione di origine ?

Supponiamo di avere una popolazione con un numero infinitamente grande di individui, di cui una certa proporzione presenta un certo carattere (A)

Indicheremo con P la proporzione della popolazione di origine

Se si estraggono a caso un campione contenente n individui, indicheremo con p la proporzione osservata nel campione.

Page 19: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Ora ci poniamo la domanda:conoscendo P, cioè la proporzione effettiva della popolazione di origi-ne, che cosa possiamo prevedere circa la proporzione p che incontre-remo in un campione estratto a caso?

Supponiamo una popolazione nella quale la proporzione P degli individui portatori di un certo carattere sia pari al 30% (PA = 0,30) e supponiamo di estrarre a caso da questa popolazione un campione di 10 individui.Indichiamo con A gli individui portatori del carattere e con B (Non A) gli altri individui

la fluttuazione casuale in un campione e la fluttuazione casuale in un campione e

la distribuzione binomialela distribuzione binomiale

Page 20: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

A B (non A)10 09 18 27 36 45 54 63 72 81 90 10

- non sappiamo quale tra questi risultati effettivamente si presenterà

- tutte i risultati sono possibili, ma non tutti sono egualmente probabili

In un’estrazione di 10 individui sono possibili 11 risultati:

Page 21: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

La probabilità che un risultato ha di presentarsi può essere calcolata

La probabilità px di una risultato nel quale il carattere A si presenti x volte su un totale di n è data dall’espressione:

px= n! Px * Qn-x x! (n - x)!dove:P è la proporzione della popolazione di origine e Q = 1 - P

Binom(x,p=0.3;n=10)

Page 22: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Nel caso utilizzato da esempio: P = 0,3; abbiamo un campione di 10 individui La probabilità p0 di incontrare un campione che nonnon

contenga individui del tipo A (cioè x = 0) è pari a: 10! (0,30) (0,710) = 0,0282 0! * 10!

cioè a 2,82%

La probabilità p1 di incontrare un campione che

contenga un individuo di tipo A {cioè x=1} è pari a: 10! (0,31) (0,79) = 0,1211 1! 9! e così di seguito per le altre 9 combinazioni

Binom(x,p=0.3;n=10)

Page 23: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

x. Numero di A in un campione di

10

n!

x! (n – x)!

Px

0,3x

Qn-x

0,7n-x

Px

100*Probabilità di incontrare il

campione

0 1 1 282 475 24910-10 2,82 1 10 310-1 40 353 60710-9 12,11 2 45 910-2 5 764 80110-8 23,35 3 120 2710-3 823 54310-7 26,68 4 210 8110-4 117 64910-6 20,01 5 252 24310-5 16 80610-5 10,29 6 210 72910-6 2 40110-4 3,68 7 120 218710-7 34310-3 0,90 8 45 656110-8 4910-2 0,145 9 10 1968310-9 710-1 0,014

10 1 5904910-10 1 0,0006

Probabilità di incontrare individui di tipo A in un campione di 10 individui, estratto da una popolazione in cui la proporzione di individui di tipo A sia P = 0,3

Binom(x,p=0.3;n=10)

Page 24: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Somma[Binom(x,p=0.3;n=10)] per {7 x 10}

Potremo ragionevolmente tener conto di escludere l’ipotesi di estrarre un campione contenente più di 6 individui di tipo A

In effetti la probabilità di più di 6 individui è la somma delle probabilità di ottenere 7, 8, 9 e 10 individui, cioè:

0,9 + 0,145 + 0,014 + 0,0006 = 1,06% Questi 4 valori costituiscono quello che si chiama una regione critica o regione di significatività o regione di respinta.

La probabilità di 1,06%, che è quella di ottenere un valore qualunque nella regione di significatività, è chiamata il livello di significatività o livello criticoI valori situati al di fuori della regione critica sono la regione di accettazione o regione di non significatività

Page 25: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

E’ chiaro che nel caso presente avremo una probabilità di:

100,00 - 1,06 = 98.94 % che una estrazione fornisca un campione comprendente fra 0 e 6 individui A

Si dice che “i valori 0 - 6 sono la regione di non significatività per il livello critico dell’ 1,06 %”

Negli esperimenti biologici si utilizzano in genere 2 livelli critici:- il livello del 5 % considerato come frontiera della regione

“significativa”- il livello dell’ 1 % considerato come frontiera della regione

“altamente significativa”

Somma[Binom(x,p=0.3;n=10)] per {0 x 6}

Page 26: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

2.82

12.11

23.35

26.68

20.01

10.29

3.68

0.90.145 0.014 0.0006

0

5

10

15

20

25

30

0 1 2 3 4 5 6 7 8 9 10

numero degli individui di tipo A in un campione

pro

ba

bili

tà %

96,12 % 1,06 %

- Distribuzione delle probabilità di estrarre, da una popolazione contenente il 30 % di individui A, un campione di 10 individui comprendente 0, 1, …, 9, 10 individui A

- Sono state indicate in giallo e tratteggiate le regioni di rifiuto, per il livello critico massimo del 5 %

Page 27: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Regione critica di rifiuto

• Nell’esempio citato abbiamo stabilito la regione critica al livello di probabilità di 1,06%.

• Se accettiamo qualche rischio supplementare, possiamo include-re nella regione di rifiuto il campione contenente 0 individui di tipo A, campione che ha 2,82% probabilità di presentarsi.

• In questo caso, la regione di “non significatività” sarà rappresen-tata dai campioni comprendenti fra 1 e 6 individui di tipo A.

• La regione di “significatività” sarà rappresentata dalle 2 “code” della distribuzione, l’una a sinistra (0 di tipo A) e l’altra a destra (da 7 a 10 di tipo A).

Page 28: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Stima dei parametri

• A ciascuno dei 50 polli di un allevamento furono somministrate sei uova infettate da heterakis gallinarum. La tabella mostra i dati dell’esperimento dopo che i polli furono sacrificati.

num vermi num polli con x vermi

x osservati attesi f*xi f*xi2

0 9 50*Bin(0,6,) 0 01 12 50*Bin(1,6,) 12 122 14 50*Bin(2,6,) 28 563 11 50*Bin(3,6,) 33 994 3 50*Bin(4,6,) 12 485 1 50*Bin(5,6,) 5 256 0 50*Bin(6,6,) 0 0

totale 50 50 90 240

Media(x)=Somma(Media(x)=Somma(f*xi)/50=N*)/50=N* var(X)=(240 - 90 var(X)=(240 - 9022/50) / 49=1,59/50) / 49=1,59

=1.8/6=0.3=1.8/6=0.3

Page 29: DISTIBUZIONE BINOMIALE Probabilità di un numero limitato di successi.

Bontà di adattamento

num vermi num polli con x vermi

x osservati attesi attesi scarto0 9 50*0,117649 5.88245 3.117553.117551 12 50*0,302526 15.1263 -3.1263-3.12632 14 50*0,324135 16.20675 -2.20675-2.206753 11 50*0,185220 9.261 1.7391.7394 3 50*0,059535 2.97675 .02325.023255 1 50*0,010206 .5103 .4897.48976 0 50*0,000729 .03645 -.03645-.03645

totale 50 50 50 0