Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo...

66
Intervalli di Intervalli di Confidenza Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica – Facoltà di Economia - UniCal

Transcript of Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo...

Page 1: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di ConfidenzaIntervalli di Confidenza

Corso di Teoria dell’Inferenza Statistica 2

a.a. 2003/2004 Quarto PeriodoProf. Filippo DOMMA

Corso di Laurea in Statistica – Facoltà di Economia - UniCal

Page 2: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 2

I metodi di stima puntuali anche se corredati di tutte le proprietà giudicate desiderabili e ottimali, difficilmente potranno fornire delle stime che coincidono con il parametro incognito, poiché ci si dovrà sempre attendere un certo errore di campionamento.Nasce, quindi, l’esigenza di associare allo stimatore una misure dell’errore di stima commesso, in modo tale da valutare quanto la stima sia da considerarsi “vicina” al parametro incognito.Tali valutazioni possono essere fatte facendo riferimento alladispersione della distribuzione campionaria dello stimatore T(X).In relazione alla stima t(x), ottenuta tramite il campione osservato, e alla precisione dello stimatore, ci saranno dei valori di che sulla base del campione debbono essere considerati più plausibilidi altri.Definito, quindi, il grado di plausibilità si potrà dividere lo spazio parametrico in due sottoinsiemi:

Page 3: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 3

uno di valori probabili per secondo il grado di plausibilità fissato ed un altro di valori poco probabili per . Così, invece di stimare un unico valore per , si stimerà un insieme di valori possibili a cuiverrà associato il grado di plausibilità scelto il quale deve essere interpretato come livello di confidenza per l’insieme.

Page 4: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 4

Sia X un c.c. estratto da f(x;) appartenente alla famiglia di distribuzioni P. Diamo la seguente Definizione. La famiglia di intervalli S(X) di , funzione di X

ma non di , è chiamato intervallo casuale. S(X) è del tipo

)(),(__

XX

dove )(X

)(__

Xe

sono, rispettivamente, il limite inferiore e superiore dell’intervallo casuale.

Page 5: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 5

Definizione. Per un dato valore di (usualmente piccolo), 0< <1, un intervallo di confidenza al 100(1-)% per è la realizzazione di un intervallo casuale tale che

1)()(Pr XX

La quantità

)()(Pinf r XX

in genere è uguale ad 1-, è chiamato coefficiente fiduciario dell’intervallo casuale.

Page 6: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 6

Un metodo generale per la costruzione di intervalli di confidenzaè costituito dalla ricerca di una funzione del campione e del parametro incognito da stimare che abbia una distribuzione indipendente da parametro stesso.

Page 7: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 7

1qQqP 21r

2n11 q);x,...,x(qq

Metodo della Quantità PivotMetodo della Quantità Pivot

Definizione. Quantità Pivot.

Sia X1,…,Xn un c.c. estratto da una fd (o fp) f(x;) appartenente a PP.

Sia Q=q(X1,…,Xn;) una funzione del c.c. e del parametro incognito . Se la v.c. Q ha distribuzione indipendente da , allora Q è detta quantità pivot.

Definizione. Quantità Pivot.

Sia X1,…,Xn un c.c. estratto da una fd (o fp) f(x;) appartenente a PP.

Sia Q=q(X1,…,Xn;) una funzione del c.c. e del parametro incognito . Se la v.c. Q ha distribuzione indipendente da , allora Q è detta quantità pivot.

Se Q=q(X;) è una quantità pivot, allora per ogni fissato, 0<<1, esisteranno due valori q1 e q2 dipendenti da , tali che

Se Q=q(X;) è una quantità pivot, allora per ogni fissato, 0<<1, esisteranno due valori q1 e q2 dipendenti da , tali che

Per ogni c.o. x1,…,xn, si ha:Per ogni c.o. x1,…,xn, si ha:

Ora, se da questa doppia diseguaglianza, riusciamo a calcolare la seguente: Ora, se da questa doppia diseguaglianza, riusciamo a calcolare la seguente:

Page 8: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 8

)x,...,x(t)x,...,x(t n12n11

Per funzioni t1 e t2 indipendenti da , allora (t1,t2) è un intervallo fiduciario (di confidenza) al 100(1-)% per .

Per funzioni t1 e t2 indipendenti da , allora (t1,t2) è un intervallo fiduciario (di confidenza) al 100(1-)% per .

In tal modo costruiamo un I.C. per in due fasi:

1a - individuare la q.p.;

2a - invertire la doppia diseguaglianza in termini di .

In tal modo costruiamo un I.C. per in due fasi:

1a - individuare la q.p.;

2a - invertire la doppia diseguaglianza in termini di .

Page 9: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 9

0\),(:(.,.)NP 2

Campionamento da popolazioni Normali Campionamento da popolazioni Normali

Sia X un c.c. iid estratto da Sia X un c.c. iid estratto da

Costruire un I.C. per con il metodo della quantità pivot.Costruire un I.C. per con il metodo della quantità pivot.

Esistono due casi distinti:

a) varianza nota;

b) varianza sconosciuta.

Esistono due casi distinti:

a) varianza nota;

b) varianza sconosciuta.

Page 10: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 10

0\),(:(.,.)NP 20

n,N~X

n

1X

20

n

1ii

A) Varianza nota A) Varianza nota

1) Individuazione della Quantità Pivot.

Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito () con fd (o fp) indipendente dal parametro incognito.

1) Individuazione della Quantità Pivot.

Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito () con fd (o fp) indipendente dal parametro incognito.

Sia X un c.c. iid estratto da N(.;.). Sappiamo che, in tale contesto, la media campionaria ha la seguente distribuzione

Sia X un c.c. iid estratto da N(.;.). Sappiamo che, in tale contesto, la media campionaria ha la seguente distribuzione

E’ evidente che la media campionaria non è una quantità pivot. E’ evidente che la media campionaria non è una quantità pivot.

Page 11: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 11

)1,0(N~n/

XZ

0

);(qZ X

1qZqP 21r

Consideriamo la standardizzazione della media campionaria, cioè:Consideriamo la standardizzazione della media campionaria, cioè:

Z è una quantità pivot per ; infatti, si ha:Z è una quantità pivot per ; infatti, si ha:

1) è funzione del c.c. X e del parametro incognito , cioè1) è funzione del c.c. X e del parametro incognito , cioè

2) Z ha distribuzione indipendente dal parametro incognito . 2) Z ha distribuzione indipendente dal parametro incognito .

Fissato , con 0< <1, possiamo trovare due valori, q1 e q2, tali che Fissato , con 0< <1, possiamo trovare due valori, q1 e q2, tali che

Page 12: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 12

21r21r q);(qqPqZqP1 X

2

0

1r qn/

XqP

n/qXn/qP 0201r

n/qXn/qXP 0201r

n/qXn/qXP 0201r

n/qXn/qXP 0102r

2) Inversione della doppia diseguaglianza in termini di ;2) Inversione della doppia diseguaglianza in termini di ;

Page 13: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 13

21

ZqPr

zq2

1

2

qZP 2r

zq2

2

La determinazione di q1 e q2 dipende da e dalla fd (o fp) della q.p.La determinazione di q1 e q2 dipende da e dalla fd (o fp) della q.p.

Generalmente, viene fissato ad un valore molto basso 0.01, 0.05.

Ripartiamo in parti uguali, sulle code della normale standardizzata, in modo tale che

Generalmente, viene fissato ad un valore molto basso 0.01, 0.05.

Ripartiamo in parti uguali, sulle code della normale standardizzata, in modo tale che

Page 14: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 14

1n

zXn

zXP 00r

22

nzXT 0

12

nzXT 0

22

nzx ,

nzx 00

22

Sostituendo si ha:Sostituendo si ha:

Gli estremi dell’intervallo casuale (T1,T2), sono:Gli estremi dell’intervallo casuale (T1,T2), sono:

Osservato il c.c. x=(x1,…,xn), l’Intervallo di confidenza al 100(1-)% per è:Osservato il c.c. x=(x1,…,xn), l’Intervallo di confidenza al 100(1-)% per è:

Page 15: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 15

Sia X X1 9,.... un c.c. estratto da una popolazione statistica che è benadattata da una v.c. Normale con media incognita e varianza pari a 25.Utilizzando le realizzazioni finite delle variabili casuali componenti ilcampione, abbiamo calcolato il valore della media campionaria, pari a 27.Determinare l’intervallo di confidenza per la media della popolazione allivello di confidenza pari al 97%.

Esempio.Esempio.

Il termine fiduciario nasce dalla seguente osservazione:se estraessimo dalla popolazione ripetutamente campioni di dimensione n e se calcolassimo per ognuno di questi l’intervallo(t1,t2), la frequenza relativa di intervalli che contengono tenderebbeal 100(1-)%. Abbiamo, quindi, una considerevole fiducia che l’intervallo osservato contenga . La misura della nostra fiducia è 100(1-)%.

Page 16: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 16

0\),(:(.,.)NP 2

)1,0(N~n/

XZ

B) Varianza sconosciutaB) Varianza sconosciuta

1) Individuazione della Quantità Pivot.

Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito () con fd (o fp) indipendente dal parametro incognito.

1) Individuazione della Quantità Pivot.

Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito () con fd (o fp) indipendente dal parametro incognito.

Dire perché la quantitàDire perché la quantità

non è utile per costruire un I.C. per con sconosciuta.non è utile per costruire un I.C. per con sconosciuta.

Page 17: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 17

)1,0(N~n/

XZ

)1n(~S)1n(

V 22

2

)1n(t~

)1n(V

ZT

Osservazione:Osservazione:

Si dimostra, inoltre, che:Si dimostra, inoltre, che:

Sappiamo che:Sappiamo che:

In definitiva, la v.c. T ha distribuzione indipendente da parametri incogniti (dipende solo dai gradi di libertà n-1).

In definitiva, la v.c. T ha distribuzione indipendente da parametri incogniti (dipende solo dai gradi di libertà n-1).

Page 18: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 18

n/S

X

Sn/

Xn/

X

)1n(V

ZT

)1n(

S)1n(2

2

)1n(t~n/S

XT

1qTqP 21r

Si osservi, ora, che Si osservi, ora, che

In definitiva, abbiamo In definitiva, abbiamo

Quest’ultima quantità è una q.p.; infatti, T è funzione di X e di , con f.d. indipendente da parametri incogniti. Individuata la q.p., fissato , possiamo trovare q1 e q2 tali che

Quest’ultima quantità è una q.p.; infatti, T è funzione di X e di , con f.d. indipendente da parametri incogniti. Individuata la q.p., fissato , possiamo trovare q1 e q2 tali che

Page 19: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 19

21r21r q);(qqPqTqP1 X

21r qn/S

XqP

n/SqXn/SqP 21r

n/SqXn/SqXP 21r

n/SqXn/SqXP 21r

n/SqXn/SqXP 12r

2) Inversione della doppia diseguaglianza in termini di ;2) Inversione della doppia diseguaglianza in termini di ;

Page 20: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 20

2

TqP 1r

1)-(ntq2

1

22

qTPr

1)-(ntq2

2

Ripartiamo in parti uguali, sulle code della t di Student, in modo tale che Ripartiamo in parti uguali, sulle code della t di Student, in modo tale che

La determinazione di q1 e q2 dipende da e dalla fd (o fp) della q.p.La determinazione di q1 e q2 dipende da e dalla fd (o fp) della q.p.

Page 21: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 21

1t

n

SXt

n

SXP )1n()1n(

22r

)1n(2

tn

SXT1 )1n(

2t

n

SXT2

)1n( , )1n(

22t

n

sxt

n

sx

Sostituendo si ha:Sostituendo si ha:

Gli estremi dell’intervallo casuale (T1,T2), sono:Gli estremi dell’intervallo casuale (T1,T2), sono:

Osservato il c.c. x=(x1,…,xn), l’Intervallo di confidenza al 100(1-)% per è:Osservato il c.c. x=(x1,…,xn), l’Intervallo di confidenza al 100(1-)% per è:

Page 22: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 22

In un grande comune rurale, da un’indagine campionaria su 900famiglie, è risultato un reddito medio di 2.3 milioni ed unadeviazione standard di 0.8 milioni. Si determini l’intervallo diconfidenza per il reddito medio annuo di tutte le famiglie, sottol’ipotesi che lo stesso segua una v.c. Normale, al livello diconfidenza del 95%.

Esempio.Esempio.

Page 23: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 23

nzx ,

nzx 00

22

nz2

nzx

nzxL 000

222

nz

2

L 0

2

Osservazione - 1Osservazione - 1

Dato l’intervalloDato l’intervallo

La lunghezza ( L ) dell’intervallo di confidenza è definita come differenza tra gli estremi dell’intervallo stesso, cioè

La lunghezza ( L ) dell’intervallo di confidenza è definita come differenza tra gli estremi dell’intervallo stesso, cioè

Si definisce errore la lunghezza dell’intervallo diviso 2, cioèSi definisce errore la lunghezza dell’intervallo diviso 2, cioè

Page 24: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 24

- a parità di :

- L diminuisce al diminuire di ;

- L diminuisce all’aumentare di n.

- a parità di :

- L diminuisce al diminuire di ;

- L diminuisce all’aumentare di n.

- a parità di n e :

- L diminuisce all’aumentare di

[in tal caso diminuisce il grado di fiducia (1-) ]

- a parità di n e :

- L diminuisce all’aumentare di

[in tal caso diminuisce il grado di fiducia (1-) ]

Situazione ottima: L piccolo - (1-) elevatoSituazione ottima: L piccolo - (1-) elevato

Page 25: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 25

Osservazione - 2Osservazione - 2

Fissato , a parità di e s e della dimensione campionaria n, gli intervalli di confidenza per la media della popolazione costruiti con T sono più ampi.

Fissato , a parità di e s e della dimensione campionaria n, gli intervalli di confidenza per la media della popolazione costruiti con T sono più ampi.

Page 26: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 26

L :n

nz2 0

2nz2 0

2

2

0

2z2n

Osservazione - 3Osservazione - 3

In alcuni casi, è necessario calcolare la dimensione campionaria minima affinché l’I.C. abbia una lunghezza prefissata.

In alcuni casi, è necessario calcolare la dimensione campionaria minima affinché l’I.C. abbia una lunghezza prefissata.

Così,ad esempio, nel caso di I.C. per con noto, si ha: Così,ad esempio, nel caso di I.C. per con noto, si ha:

Page 27: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 27

Le uova prodotte in una azienda agricola hanno un peso che sidistribuisce secondo una normale con media incognita e varianza pariaa 49. Determinare la dimensione del campione che consente di stimare ,mediante la media campionaria, con un errore non superiore a 4 con unaprobabilità di 0.95.

EsempioEsempio

Page 28: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 28

0\),(:(.,.)NP 2

Campionamento da popolazioni Normali Campionamento da popolazioni Normali

Sia X un c.c. iid estratto da Sia X un c.c. iid estratto da

Esistono due casi distinti:

a) sconosciuta;

b) nota.

Esistono due casi distinti:

a) sconosciuta;

b) nota.

Costruire un I.C. per 2 con il metodo della quantità pivot.Costruire un I.C. per 2 con il metodo della quantità pivot.

Page 29: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 29

)1n(~

XXS)1n(

V 22

n

1i

2

i

2

2

A) Media sconosciutaA) Media sconosciuta

1) Individuazione della Quantità Pivot.

Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito () con fd (o fp) indipendente dal parametro incognito.

1) Individuazione della Quantità Pivot.

Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito () con fd (o fp) indipendente dal parametro incognito.

Si è visto in precedenza che la quantitàSi è visto in precedenza che la quantità

E’ evidente che V è una funzione del c.c. X e del parametro incognito ; inoltre, si distribuisce secondo una chi-quadrato con (n-1) gradi di libertà ovvero la distribuzione non dipende da parametri incogniti. Da ciò si può concludere che V è una quantità pivot per

E’ evidente che V è una funzione del c.c. X e del parametro incognito ; inoltre, si distribuisce secondo una chi-quadrato con (n-1) gradi di libertà ovvero la distribuzione non dipende da parametri incogniti. Da ciò si può concludere che V è una quantità pivot per

Page 30: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 30

22

1r21r q);(qqPqVqP1 X

2

2

2

1r22

2

1r q

1

S)1n(q

1Pq

S)1n(qP

2

22

1

2

r q

S)1n(

q

S)1n(P

1

22

2

2

r q

S)1n(

q

S)1n(P

2) Inversione della doppia diseguaglianza in termini di ;2) Inversione della doppia diseguaglianza in termini di ;

Fissato , possiamo determinare q1 e q2 tali che Fissato , possiamo determinare q1 e q2 tali che

Page 31: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 31

2

VqP 1r

q 1)-(n2

12

22

VqPr

q 1)-(n212

2

Ripartiamo in parti uguali, sulle code della Chi-quadrato, in modo tale che Ripartiamo in parti uguali, sulle code della Chi-quadrato, in modo tale che

La determinazione di q1 e q2 dipende da e dalla fd (o fp) della q.p.La determinazione di q1 e q2 dipende da e dalla fd (o fp) della q.p.

Page 32: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 32

)1n(21

2

1

2

S)1n(T

1S)1n(S)1n(

P)1n()1n(

2

22

21

2

r

22

)1n(2

2

2

2

S)1n(T

)1n()1n(2

2

21

2

22

s)1n( ,

s)1n(

Gli estremi dell’intervallo casuale (T1,T2), sono:Gli estremi dell’intervallo casuale (T1,T2), sono:

Osservato il c.c. x=(x1,…,xn), l’Intervallo di confidenza al 100(1-)% per è:Osservato il c.c. x=(x1,…,xn), l’Intervallo di confidenza al 100(1-)% per è:

Sostituendo si ha:Sostituendo si ha:

Page 33: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 33

)n(~

Xˆn

V 22

n

1i

2i

2

2

B) Media notaB) Media nota

1) Individuazione della Quantità Pivot.

Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito () con fd (o fp) indipendente dal parametro incognito.

1) Individuazione della Quantità Pivot.

Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito () con fd (o fp) indipendente dal parametro incognito.

E’ evidente che V è una funzione del c.c. X e del parametro incognito ; inoltre, si distribuisce secondo una chi-quadrato con (n) gradi di libertà ovvero la distribuzione non dipende da parametri incogniti. Da ciò si può concludere che V è una quantità pivot per

E’ evidente che V è una funzione del c.c. X e del parametro incognito ; inoltre, si distribuisce secondo una chi-quadrato con (n) gradi di libertà ovvero la distribuzione non dipende da parametri incogniti. Da ciò si può concludere che V è una quantità pivot per

Page 34: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 34

1ˆnˆn

P)n()n(

2

22

21

2

r

22

)n(21

2

1

2

ˆnT

)n(

2

2

2

2

ˆnT

)n()n(2

2

21

2

22

ˆn ,

ˆn

Utilizzando lo stesso procedimento del caso (A), si ottiene l’I.C. per 2, cioèUtilizzando lo stesso procedimento del caso (A), si ottiene l’I.C. per 2, cioè

Gli estremi dell’intervallo casuale (T1,T2), sono:Gli estremi dell’intervallo casuale (T1,T2), sono:

Osservato il c.c. x=(x1,…,xn), l’Intervallo di confidenza al 100(1-)% per è:Osservato il c.c. x=(x1,…,xn), l’Intervallo di confidenza al 100(1-)% per è:

Page 35: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 35

Il diametro delle sfere di acciaio, prodotte da una determinata industria, è adattatostatisticamente da una v.c. X che si distribuisce come una Normale. Si effettua uncampionamento casuale di numerosità 9 e si misura il diametro delle sfere costituenti ilcampione. I risultati, realizzazioni delle v.c. componenti il campione, sono i seguenti :20.1 , 19.9 , 20 , 19.8 , 19.7 , 20.2 , 20.1 , 23.1 , 22.8Determinare l’intervallo di confidenza al livello del 90% per il valor medio dellapopolazione ed un altro intervallo allo stesso livello di confidenza per la varianza dellapopolazione.

Esempio.Esempio.

Page 36: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 36

2xx ,N~X 2

yy ,N~Y

)1m( X)1n( Y

m,N~X

2x

x

n,N~Y

2y

y

Intervallo di Confidenza per la differenza tra le medie

di due popolazioni Normali.

Intervallo di Confidenza per la differenza tra le medie

di due popolazioni Normali.

Siano X ed Y due v.c. indipendenti e normalmente distribuite, cioèSiano X ed Y due v.c. indipendenti e normalmente distribuite, cioè

Page 37: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 37

2x 2

y

YXD

yxDE

nm

DV2y

2x

nmND yx

yx

22

, ~

Vogliamo costruire un I.C. per la differenza tra le medie x e y.Vogliamo costruire un I.C. per la differenza tra le medie x e y.

Primo Caso:Primo Caso: ee NoteNote

Stimatore naturale della differenza tra le medie Stimatore naturale della differenza tra le medie

E’ semplice verificare che E’ semplice verificare che

Page 38: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 38

1 , 0 ~22

N

nm

DZ

yx

yx

21r qZqP1

La v.c.La v.c.

E’ una quantità pivot perché è funzione del c.c. (X,Y) e del parametro incognito (x-y) ed ha distribuzione indipendente da parametri incogniti.

Fissato , possiamo determinare q1 e q2 tali che

E’ una quantità pivot perché è funzione del c.c. (X,Y) e del parametro incognito (x-y) ed ha distribuzione indipendente da parametri incogniti.

Fissato , possiamo determinare q1 e q2 tali che

Page 39: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 39

222

1 q

nm

DqP

yx

yxr

nm

qDnm

qP2y

2x

2yx

2y

2x

1r

nm

qDnm

qDP yxyx

yxr

22

2

22

1 )(

Page 40: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 40

nm

qDnm

qDP yxyx

yxr

22

2

22

1

nm

qDnm

qDP yxyx

yxr

22

1

22

2

qZP2

qZP 2r1r2

zq1 2

zq2

Ricordando che Ricordando che

Page 41: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 41

1nm

zDnm

zDP2y

2x

xx

2y

2x

r22

nmzDT

2y

2x

12

nmzDT

2y

2x

22

Si ottiene:Si ottiene:

Gli estremi dell’intervallo casuale (T1,T2), per la differenza tra le medie nel caso di varianze note, sono:

Gli estremi dell’intervallo casuale (T1,T2), per la differenza tra le medie nel caso di varianze note, sono:

Page 42: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 42

nmzd ,

nmzd

2y

2x

2y

2x

22

yxd

m

1iix

m

1x

n

1iiy

n

1y

Osservati x=(x1,…,xm) e y=(y1,…,yn), l’I.C. per la differenza tra le medie (x-y), nel caso di varianze note, al 100(1-)% è:

Osservati x=(x1,…,xm) e y=(y1,…,yn), l’I.C. per la differenza tra le medie (x-y), nel caso di varianze note, al 100(1-)% è:

dovedove

conconee

Page 43: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 43

22y

2x

YXD

1 , 0 ~1122

N

nm

D

nm

DZ yx

yx

yx

Se le varianza sono sconosciute, Z non è una quantità pivot per (x-y).Se le varianza sono sconosciute, Z non è una quantità pivot per (x-y).

Secondo Caso: varianze uguali ma sconosciuteSecondo Caso: varianze uguali ma sconosciute

Stimatore naturale della differenza tra le medie Stimatore naturale della differenza tra le medie

Da quanto detto in precedenza, si evince che Da quanto detto in precedenza, si evince che

Page 44: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 44

)1m(~

XXS)1m(

V 22

m

1i

2

i

2

2x

1

)1n(~

YYS)1n(

V 22

n

1i

2

i

2

2y

2

)2mn(~YYXX1

VV 2n

1i

2

i

m

1i

2

i211

Si osserva, inoltre, che Si osserva, inoltre, che

Poiché V1 e V2 sono indipendenti, dalla proprietà riproduttiva della v.c. chi-quadrato, si ha:

Poiché V1 e V2 sono indipendenti, dalla proprietà riproduttiva della v.c. chi-quadrato, si ha:

Page 45: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 45

)2mn(t~

)2nm(VV

ZT

21

n1

m1

S

D

)2nm(

S)1n(S)1m(

n1

m1

D

T

p

yx

2

2y

2x

yx

Dato che le v.c. Z e V1+V2 sono indipendenti, possiamo costruire la v.c. t-student, cioèDato che le v.c. Z e V1+V2 sono indipendenti, possiamo costruire la v.c. t-student, cioè

Tale rapporto si può scrive nel seguente modo:Tale rapporto si può scrive nel seguente modo:

Page 46: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 46

)2nm(

S)1n(S)1m(S

2y

2x2

p

)2nm(

SE)1n(SE)1m(SE

2y

2x2

p

222

)2nm(

)1n()1m(

dovedove

È lo stimatore non-distorto della varianza comune 2; infatti, si ha:È lo stimatore non-distorto della varianza comune 2; infatti, si ha:

Page 47: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 47

)2(~

11

nmt

nmS

DT

p

yx

21r qTqP1

In definitiva, la v.c. In definitiva, la v.c.

È una quantità pivot perché funzione del c.c. (X,Y) e del parametro da stimare (x-y) con distribuzione che non dipende da parametri incogniti.

Fissato , possiamo determinare q1 e q2 tali che

È una quantità pivot perché funzione del c.c. (X,Y) e del parametro da stimare (x-y) con distribuzione che non dipende da parametri incogniti.

Fissato , possiamo determinare q1 e q2 tali che

Page 48: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 48

21

11q

nmS

DqP

p

yxr

nm

SqDnm

SqP pyxpr

111121

nm

SqDnm

SqDP pyxpr

111121

nm

SqDnm

SqDP pyxpr

111121

Page 49: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 49

nm

SqDnm

SqDP pyxpr

111112

qTP2

qTP 2r1r

)2nm(

)2nm(

2

2

tq

tq

2

1

Ricordando che Ricordando che

Page 50: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 50

11111

)2()2(22 nmnm

pyxpr StDStDP nmnm

n

1

m

1p1 StDT )2nm(

2

n

1

m

1p2 StDT )2nm(

2

Sostituendo, si ottiene:Sostituendo, si ottiene:

Gli estremi dell’intervallo casuale (T1,T2), per la differenza tra le medie nel caso di varianze incognite ma uguali, sono:

Gli estremi dell’intervallo casuale (T1,T2), per la differenza tra le medie nel caso di varianze incognite ma uguali, sono:

Page 51: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 51

n

1

m

1

n

1

m

1pp std , std )2nm()2nm(

22

yxd

m

1iix

m

1x

n

1iiy

n

1y

)2nm(

)1n()1m(2y

2x2

p

sss

m

1i

2i

2x xx

1m

1s

n

1i

2i

2y yy

1n

1s

Osservati x=(x1,…,xm) e y=(y1,…,yn), l’I.C. per la differenza tra le medie (x-y), nel caso di varianze incognite ma uguali, al 100(1-)% è:

Osservati x=(x1,…,xm) e y=(y1,…,yn), l’I.C. per la differenza tra le medie (x-y), nel caso di varianze incognite ma uguali, al 100(1-)% è:

dovedove

concon

ee

Page 52: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 52

Per provare l’efficacia di due nuovi semi per la produzione di grani sottocondizioni climatiche normali, un’industria di semi selezionacasualmente otto aziende agricole in una regione italiana e provaentrambi i semi su una determinata superficie coltivabile. Le produzioniper le otto aziende, secondo il seme utilizzato, sono le seguenti:A : 86, 87, 56, 93, 84, 93, 75, 79B : 80, 79, 58, 91, 77, 82, 74, 66Supponendo che le due produzione siano, in ogni azienda, distribuitenormalmente e che le varianze delle due popolazioni siano uguali,determinare l’intervallo di confidenza per la differenza delle produzionimedie, ad un livello di confidenza del 95%.

EsempioEsempio

Page 53: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 53

Intervallo di Confidenza sulla probabilità di successoIntervallo di Confidenza sulla probabilità di successo

Sia X una v.c. di Bernoulli con probabilità di successo pari a . Si ricorda che E(X)= e V(X)= (1- ).Dato un c.c. X1,…,Xn estratto da B(,1), si vuole costruire unintervallo di Confidenza per al 100(1-)%.Consideriamo la proporzione di successi in n-prove indipendenti

n

1iiX

n

1X

Sappiamo che

XE n

)1(XV

Page 54: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 54

Dal teorema di De Moivre-Laplace, sappiamo che

)1,0(N

n)1(

X

XV

XEXZ

n

d

Si evidenzia che la v.c. Z pur essendo una q.p. (perché è funzione del c.c. e del parametro incognito ed ha distribuzione indipendenteda parametri incogniti) NON può essere utilizzata per costruire un intervallo di confidenza asintotico per la probabilità di successo.Infatti, la varianza della popolazione è sconosciuta. E’ necessario quindi stimare la varianza della popolazione.

Page 55: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 55

Consideriamo lo stimatore naturale della varianza della popolazione

X1XXXn

1XX

n

1S 2

n

1ii

2n

1i

2i

'2

Perché

n

1ii

n

1i

2i XX essendo Xi=0 oppure Xi=1.

Consideriamo, ora, la varianza campionaria non-distorta

1n

X1XnS

1n

nS

'22

Page 56: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 56

)1n(X1X

X

)1n(nX1Xn

X

nS

X

XV

XEXZ

2

Sostituiamo a V(X) lo stimatore non-distorto S2

Si dimostra che

)1,0(N

)1n(X1X

XZ

n

d

Quest’ultima è una quantità pivot per la probabilità di successo .

Page 57: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 57

Fissato , possiamo determinare q1 e q2 tali che

21r qZqP1

21r q

1nX1X

XqP

1n

X1XqX

1n

X1XqP 21r

Page 58: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 58

1n

X1XqX

1n

X1XqXP 21r

1n

X1XqX

1n

X1XqXP 12r

Analogamente, a quanto visto in precedenza possiamo dire che

2zq1

2zq2

Page 59: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 59

11n

X1XzX

1n

X1XzXP

22r

Sostituendo abbiamo

1n

X1XzXT

21

Gli estremi dell’intervallo casuale (T1,T2), per la probabilità di successo, sono: Gli estremi dell’intervallo casuale (T1,T2), per la probabilità di successo, sono:

1n

X1XzXT

22

Page 60: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 60

1n

)x1(xzx ,

1n

)x1(xzx

22

Osservato x=(x1,…,xm) , l’I.C. asintotico per la probabilità di successo al 100(1-)% è:

Osservato x=(x1,…,xm) , l’I.C. asintotico per la probabilità di successo al 100(1-)% è:

dovedove

n

1iix

n

1x

Page 61: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 61

Esempio.Esempio.

Dal deposito di una industria che produce lampade, si estrae un c.c.di 350 unità e si osserva che il 25% sono difettose. Si determini unintervallo di confidenza per la proporzione di lampade difettoseprodotte dall’industria in esame, al livello di confidenza del 95%.

Page 62: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 62

Page 63: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 63

Page 64: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 64

Page 65: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 65

Page 66: Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Intervalli di Confidenza F. Domma 66