Num 01 - 1 / 36 Lezione 9 Numerosità del campione.
-
Upload
bice-biondi -
Category
Documents
-
view
220 -
download
1
Transcript of Num 01 - 1 / 36 Lezione 9 Numerosità del campione.
Num 01 - 1 / 36
Lezione 9Numerosità del campione
Num 01 - 2 / 36
parte 1la numerosità minima del campione
Num 01 - 3 / 36
• come tutti gli strumenti di misura, anche gli stimatori sono imperfetti e la loro stima del parametro presenta un’incertezza che viene quantificata attraverso l’intervallo di confidenza:
• Dato un campione con immagini { X1, X2, …, Xn } proveniente da una
popolazione su cui è definita una variabile casuale X avente densità f (x)
qualsiasi con media e varianza 2 si possono usare la media campionaria e la varianza campionaria corretta per stimare i valori dei parametri della popolazione.
gli strumenti di inferenza
mnX vsnvin SS 222
n
j
jn Xn
X1
1
n
j
njn XXn
S1
22
1
1
vnS 22
Num 01 - 4 / 36
la numerosità minima del campione nella stima della media
Num 01 - 5 / 36
distribuzione della media campionaria
• dato un campione con immagini { X1, X2, …, Xn } proveniente
da una popolazione infinita su cui è definita una variabile
casuale X con densità f (x) qualsiasi, media e varianza 2, la media campionaria
fornisce una variabile casuale che, per n sufficientemente
grande, risulta distribuita in modo normale, con media
e con varianza 2 / n
n
jjn X
nX
1
1
Num 01 - 6 / 36
• dato che la media campionaria segue una distribuzione normale
con media e varianza 2 / nè possibile costruire una variabile casualecon distribuzione normale standard, cioè con media nulla e varianza unitaria n
XZ n
dalla media campionaria alla media campionaria standardizzata
• tramite la variabile Z è agevole individuare l’intervallo di confidenza della media campionaria, che può essere visto come l’incertezza dello strumento inferenziale
Num 01 - 7 / 36
intervallo di confidenza a “1 - ” per la media
da cui, per la simmetria della f ( Z ) , si ottiene:
12/12/ a
na z
n
XzP
Num 01 - 8 / 36
intervallo di confidenza a “1 - ” per la media
da cui:
12/12/1 anan z
nXz
nXP
12/12/1 a
na z
n
XzP
Num 01 - 9 / 36
intervallo di confidenza a “1 - ” per la media
possiamo quindi sostenere che:
estraendo a caso un campione con immagini { X1, X2, …, Xn },
con n sufficientemente grande, da una popolazione infinita su cui è definita una variabile casuale X con distribuzione qualsiasi,
media e varianza 2, c’è una probabilità pari a 1 - che l’intervallo casuale
con Z variabile normale standard e con z1-/2 il valore del suo
quantile (1 - /2) contenga il valore della media della X per l’intera popolazione.
I1- è chiamato intervallo di confidenza allo 1 - per la media
2/12/11 , anana z
nXz
nXI
Num 01 - 10 / 36
da cui si ottiene:
ampiezza dell’intervallo di confidenzae numerosità del campione
2/12/11 , anan z
nXz
nXI
2/11 2 azn
A
2
1
2/124
A
zn a
possiamo quindi affermare che:
indicando con A1- l’ampiezza di I1-, intervallo di confidenza
allo 1 - per la media, si ha:
Num 01 - 11 / 36
Se si è prefissato un valore massimo accettabile per l’ampiezza
dell’intervallo di confidenza, valore che indichiamo con A1-max ,
allora è possibile esplicitare il corrispondente valore minimo per
la numerosità del campione nmin :
ampiezza dell’intervallo di confidenzae numerosità del campione
2
1
2/124
A
zn a
30
4
min
2
max,1
2/12min
n
A
zn a
Num 01 - 12 / 36
ampiezza dell’intervallo di confidenzae numerosità del campione
Qualora la varianza della X per l’intera popolazione non sia conosciuta si può condurre il calcolo della numerosità richiesta al campione mediante lo stimatore “varianza campionaria corretta”:
n
S
XT
n
n
2
n
j
njn XXn
S1
22
1
1
Sappiamo che se n è sufficientemente grande la variabile casuale
segue una distribuzione “ t di Student con n-1 g.d.l ”.
Num 01 - 13 / 36
ampiezza dell’intervallo di confidenzae numerosità del campione
Possiamo quindi affermare che, se n è sufficientemente grande:
estraendo a caso un campione con immagini { X1, X2, …, Xn }
da una popolazione infinita su cui è definita una variabile casuale
X con distribuzione qualsiasi, media e varianza campionaria
Sn2, c’è una probabilità pari a 1 - che l’intervallo casuale
con T variabile “t di Student con n-1 g.d.l “
e con t1-/2 il valore del suo quantile (1 - /2)contenga il valore della media della popolazione.
2/12/11 , a
nna
nn t
n
SXt
n
SXI
Num 01 - 14 / 36
ampiezza dell’intervallo di confidenzae numerosità del campione
Sviluppando in modo analogo ai passaggi già visti nel caso di varianza della popolazione conosciuta, se si è prefissato un valore massimo accettabile per l’ampiezza dell’intervallo di
confidenza, valore che indichiamo con A1-max , allora è
possibile esplicitare il corrispondente valore minimo nmin per la numerosità del campione:
2
max,1
2/12min 4
A
tSn a
n
Un problema da considerare è rappresentato dal fatto che il
valore critico t1- /2 della t di Student dipende da n
Num 01 - 15 / 36
ampiezza dell’intervallo di confidenzae numerosità del campione
Un problema da considerare è rappresentato dal fatto che il
valore critico t1- /2 della t di Student dipende da n
Num 01 - 16 / 36
ampiezza dell’intervallo di confidenzae numerosità del campione
Un primo calcolo approssimato può essere condotto sostituendo al quantile della T il corrispondente quantile di una variabile Z normale standard.
2
max,1
2/12min 4'
A
zSn a
n
Se n’min > 30 sappiamo che la distribuzione t di Student non
differisce in maniera evidente dalla distribuzione normale standard.
Individuato così un primo valore approssimato si può
proseguire cercando il valore corretto di nmin mediante un procedimento iterativo:
Num 01 - 17 / 36
ampiezza dell’intervallo di confidenzae numerosità del campione
partendo da una prima valutazione del quantile della
t di Student calcolato per un numero di g.d.l. pari a n’min - 1
si calcola:
Con un ragionevole numero di iterazioni si può quindi individuare la numerosità richesta al campione.
2
max,1
2/12min 4
A
tSn a
n
Num 01 - 18 / 36
ampiezza dell’intervallo di confidenzae numerosità del campione
Se pensiamo di dover operare con un campione di numerosità
ridotta n < 30 dobbiamo ricordare che la distribuzione della media campionaria può essere considerata normale
solamente se anche la X segue la distribuzione normale!!!
Se ciò si verifica possiamo individuare il valore della numerosità
richiesta nmin con un procedimento uguale a quello già
mostrato per n > 30.
Num 01 - 19 / 36
ampiezza dell’intervallo di confidenzae numerosità del campione
Partiamo da una prima valutazione condotta con la:
per poi ricalcolare iterativamente il valore di nmin partendo da una
prima valutazione del quantile della t di Student calcolato per un
numero di g.d.l. pari a n’min - 1
Con un ragionevole numero di iterazioni si può quindi individuare la numerosità richesta al campione.
2
max,1
2/12min 4
A
tSn a
n
2
max,1
2/12min 4'
A
zSn a
n
Num 01 - 20 / 36
intervallo di confidenza per la media se n ≈ N
Se il numero n degli elementi del campione non è molto minore della numerosità N (finita) della popolazione:
1112/12/1 anan z
nN
nN
Xzn
N
nN
XP
la:
deve essere sostituita dalla:
12/12/1 anan z
nXz
nXP
Num 01 - 21 / 36
intervallo di confidenza per la media se n ≈ Npossiamo quindi sostenere che:
estraendo a caso un campione da una popolazione finita
composta da N elementi su cui è definita una variabile casuale X
con distribuzione qualsiasi, media e varianza 2, c’è una
probabilità pari a 1 - che l’intervallo casuale
con Z variabile normale standard e con z1-/2 il valore del suo
quantile (1 - /2) contenga il valore della media della X per l’intera popolazione.
2/12/111,1
anan zn
N
nN
Xzn
N
nN
XI
Num 01 - 22 / 36
di conseguenza possiamo affermare che:
indicando con A1- l’ampiezza di I1- , intervallo di confidenza
allo 1 - per la media, si ha:
da cui si ottiene:
numerosità del campione ed ampiezza dell’intervallo di confidenza per la media
2/12/11 1212 aa z
Nn
nNz
nN
nN
A
2
2/1
1
211
az
AN
Nn
Num 01 - 26 / 36
Se si è prefissato un valore massimo accettabile per l’ampiezza
dell’intervallo di confidenza, valore che indichiamo con A1-max ,
allora è possibile esplicitare il corrispondente valore minimo per la numerosità del campione:
numerosità del campione ed ampiezza dell’intervallo di confidenza per la media
2
2/1
max,1
min
211
az
AN
Nn
2
2/1
1
211
az
AN
Nn
Num 01 - 28 / 36
la numerosità minima del campione nella stima della varianza
Num 01 - 29 / 36
distribuzione della varianza campionaria corretta
• dato un campione con immagini { X1, X2, …, Xn } proveniente
da una popolazione infinita su cui è definita una variabile
casuale X con distribuzione normale, media e varianza 2,
la varianza campionaria corretta divisa per 2
fornisce una variabile casuale che segue una
distribuzione C 2 con n - 1 gradi di libertà
11
1
1
2
2
2
nXX
n
S n
j
njn
Num 01 - 30 / 36
Intervalli di confidenza per la varianza campionaria corretta
12/1
22
2
2/2
an
a cS
cP
/ 2 / 2
Num 01 - 31 / 36
numerosità del campione ed ampiezza dell’intervallo di confidenza per la varianza
considerando l’evento si nota che :
12/1
22
2
2/2
an
a cS
cP
2/2
22
2/12
2
2/12
2
2
2/2
a
n
a
na
na
c
S
c
Sc
Sc
da cui:
1
2/2
22
2/12
2
a
n
a
n
c
S
c
SP
Num 01 - 32 / 36
numerosità del campione ed ampiezza dell’intervallo di confidenza per la varianza
indicando con A1- l’ampiezza di I1- , intervallo di confidenza
allo 1 - per la varianza:
2/12
2/2
2
2/12
2
2/2
2
1
11
aan
a
n
a
n
ccS
c
S
c
SA
2/2
2
2/12
2
1 ,a
n
a
n
c
S
c
SI
si ottiene:
1
2/2
22
2/12
2
a
n
a
n
c
S
c
SP
Num 01 - 33 / 36
numerosità del campione ed ampiezza dell’intervallo di confidenza per la varianza
2/12
2/2
2
2/12
2
2/2
2
1
11
aan
a
n
a
n
ccS
c
S
c
SA
Sappiamo che Sn2 è uno stimatore
corretto e consistente della varianza
quindi, al crescere della numerosità n del campione, il suo valore si distribuisce in modo sempre più “concentrato in prossimità” di 2
Num 01 - 34 / 36
numerosità del campione ed ampiezza dell’intervallo di confidenza per la varianza
E’ pertanto possibile ipotizzare che, per valori di n sufficientemente elevati, la casualità con cui viene estratto il campione non faccia variare in modo
significativo il valore della varianza campionaria Sn2.
Con queste premesse, dopo aver fissato il valore massimo accettabile per la ampiezza dell’intervallo di confidenza, si può scrivere:
2/12
2/2
2
2/12
2
2/2
2
1
11
aan
a
n
a
n
ccS
c
S
c
SA
max,12/1
22/
22
1
11
A
ccSA
aan
Num 01 - 35 / 36
numerosità del campione ed ampiezza dell’intervallo di confidenza per la varianza
da cui si ottiene la:
max,12/1
22/
22
1
11
A
ccSA
aan
2
max,1
2/12
2/2
11
naa S
A
cc
2
max,1
2/2
2/12
11
naa S
A
cc
Num 01 - 36 / 36
numerosità del campione ed ampiezza dell’intervallo di confidenza per la varianza
il più basso valore dei gradi di libertà per cui i valori
critici della C 2 soddisfano la:
è pari a nmin - 1
2
max,1
2/2
2/12
11
naa S
A
cc
il valore di nmin non compare in modo esplicito,
ma deve essere individuato attraverso i gradi di
libertà della C 2