Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk...

30
Statistik – 7. gang 1 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ”ligheds” hændelse H 1 eller H A : Alternativ hypotese, der må accepteres hvis H 0 forkastes Trin 2: Vælg statistisk model Test statistik og sampling fordeling fastsættes (vælges under hensyntagen til H 0 og H 1 ) Trin 3: Vælg signifikansniveau Beslutning: H 0 er sand H 0 er ikke sand Accepter H 0 Korrekt beslutning Forkert beslutning Type II fejl Forkast H 0 Forkert beslutning Type I fejl Korrekt beslutning

Transcript of Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk...

Page 1: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 1

9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data

H0 : Nul hypotese Formuleres som en ”ligheds” hændelse

H1 eller HA: Alternativ hypotese, der må accepteres hvis H0 forkastes

Trin 2: Vælg statistisk model Test statistik og sampling fordeling fastsættes (vælges under hensyntagen til H0 og H1) Trin 3: Vælg signifikansniveau

Beslutning: H0 er sand H0 er ikke sand Accepter H0 Korrekt beslutning Forkert beslutning

Type II fejl Forkast H0 Forkert beslutning

Type I fejl Korrekt beslutning

Page 2: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 2

Beslutning: H0 er sand H0 er ikke sand Accepter H0 Korrekt beslutning Forkert beslutning

Type II fejl Forkast H0 Forkert beslutning

Type I fejl Korrekt beslutning

Type I og II fejl er ikke uafhængige Normalt tages der mest hensyn til type I fejl! Signifikansniveau: α sandsynlighed for type I fejl

β sandsynlighed for type II fejl Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Page 3: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 3

Trin 4: Indsaml data og beregn test statistik Udfra en stikprøve med n udfald beregnes test statistikken Trin 5: Definer forkastelsesområdet Det område for test statistikken, der medfører at H0 forkastes (område der er usandsynligt for test statistikken, hvis hypotesen er sand)

Page 4: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 4

Området afhænger af:

- Formuleringen af H1 - Fordelingsfunktionen for test statistikken - Signifikans-niveauet

Trin 6: Konklusion H0 accepteres hvis værdien af test statistikken ligger indenfor det acceptable område H0 forkastes og derved accept af H1 hvis værdien af test statistikken ligger udenfor det acceptable område

Page 5: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 5

9.3.1 HYPOTESETEST AF MIDDELVÆRDIER – KENDT SPREDNING Eks: Test af stål trækstyrke: kan det konkluderes at forventningsværdien af trækstyrken er mindst 325 MPa ? - spredningen er kendt: 16=σ MPa 1. trin: Hypotese:

H0 : 3250 == μμ MPa H1 : 3250 =< μμ MPa

(eller H1 : 0μμ > ) (eller H1 : 0μμ ≠ )

Page 6: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 6

I dette tilfælde udføres en enkeltsidet test, små styrker betragtes som ”kritiske”: H0 accepteres hvis αZZ −> Hvis H0 accepteres kan det ikke afvises, at middeltrækstyrken er 325 MPa eller større. 2. trin: statistisk model

Fordeling af ),(N:n

X σμ

Test statistik: )1,0(N:/ n

XZσ

μ−=

Page 7: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 7

3. trin: Signifikansniveau α = 0.01 (1 % sandsynlighed for type I fejl, dvs. at H0 forkastes selvom den er sand) 4. trin:

Udfra n = 100 og 31911

=∑==

n

iix

nX :

75.3100/16325319

/−=

−=

−=

nXZσ

μ

Page 8: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 8

5. trin: Der benyttes en enkeltsidet test, idet kun små værdier af Z er kritiske!

75.3−=Z

326.2)99.0()1( 11 =Φ=−Φ= −− ααZ ⇒ 326.2−=− αZ 6. trin: H0 forkastes, dvs. styrken er ikke acceptabel

Page 9: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 9

EKSEMPEL 1

Er forventningsværdien af indholdet i en flaske = ¾ liter? 1. trin:

H0 : 4/30 == μμ liter H1 : 4/30 =≠ μμ liter

2. trin: Hvis σ antages kendt fås: (husk sidste gang)

),(N:n

X σμ

Derved introduceres test statistikken:

)1,0(N:/ n

XZσ

μ−=

Page 10: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 10

3. trin: Signifikansniveau α = 0.01 (1 % sandsynlighed for type I fejl, dvs. at H0 forkastes selvom den er sand) 4. trin:

Forsøgsresultater: n = 30 79.011

=∑==

n

iix

nX

Med 75.0=μ og 05.0=σ fås:

15.030/05.075.079.0

/=

−=

−=

nXZσ

μ

Page 11: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 11

5. trin: Der vælges en dobbeltsidet test, idet både små og store værdier af Z er kritiske!

15.0=Z

58.2)995.0()2/1( 112/ =Φ=−Φ= −− ααZ

6. trin: H0 accepteres, idet:

58.215.058.2

2/2/

<<−⇓

<<− αα ZZZ

Page 12: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 12

9.3.2 HYPOTESETEST AF MIDDELVÆRDIER – UKENDT SPREDNING 1. trin: Hypotese: H0 og H1 : formuleres som før 2. trin: statistisk model Middelværdi X og spredning S : stokastiske variabler ⇓

Test statistik: 1:/ −−

= ntnSXt μ (t-fordeling med n-1 frihedsgrader)

3. trin: Signifikansniveau: som før, typisk α = 0.01 4. trin: Indsaml data og beregn test statistik t

Page 13: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 13

5. trin: Definer forkastelsesområdet Det område for test statistikken, der medfører at H0 forkastes (område der er usandsynligt for test statistikken, hvis hypotesen er sand)

6. trin: Konklusion accept område: H1 : 0μμ < forkast hvis )1(, −−< ntt α H1 : 0μμ > forkast hvis )1(, −> ntt α H1 : 0μμ ≠ forkast hvis )1(,2/ −−< ntt α eller )1(,2/ −> ntt α

Page 14: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 14

Page 15: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 15

EKSEMPEL 9.3 Koncentration af ilt: Er forventningsværdien af koncentrationen af ilt over grænseværdien på 3 per million ? 1. trin: Hypotese:

H0 : 30 == μμ per million H1 : 30 =< μμ per million

2. trin:

Test statistik: 1:/ −−

= ntnSXt μ (t-fordeling med n-1 frihedsgrader)

3. trin: Signifikansniveau: typisk α = 0.05 4. trin: Givet: n = 5 X =2.8 S =0.32 ⇒

398.15/32.0

38.2/

−=−

=−

=nS

Xt μ

Page 16: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 16

5. trin: Enkeltsidet test

398.1−=t

132.2)15(, −=− −αt (tabel A-2) 6. trin: H0 accepteres, idet: -1.398 > -2.132

Page 17: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 17

9.3.3 HYPOTESETEST AF 2 MIDDELVÆRDIER – UKENDT SPREDNING Population 1: 1X : N( 1μ , 1σ ): 1n samples med middelværdi 1X og spredning 1S Population 2: 2X : N( 2μ , 2σ ): 2n samples med middelværdi 2X og spredning 2S 1. trin: Hypotese: H0: middelværdier af de 2 populationer er ens: 1μ = 2μ

H1: 1μ < 2μ eller H1: 1μ > 2μ eller H1: 1μ ≠ 2μ 2. trin: Test statistik:

2121

222

211

21

112

)1()1(nnnn

SnSnXXt

+−+

−+−−

= (t-fordeling med 1n + 2n -2 frihedsgrader)

3. trin: Signifikansniveau: som før, typisk α = 0.01

Page 18: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 18

4. trin: Indsaml data og beregn test statistik t 5. trin: Definer forkastelsesområdet Det område for test statistikken, der medfører at H0 forkastes

6. trin: Konklusion accept område: H1 : 21 μμ < forkast hvis αtt −< H1 : 21 μμ > forkast hvis αtt > H1 : 21 μμ ≠ forkast hvis 2/αtt −< eller 2/αtt >

Page 19: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 19

EKSEMPEL 9-4 Udvikling af kvælstofindhold i én bæk - indhold før byudvikling: fμ - indhold efter byudvikling: eμ Er der sket en ændring? 1. trin: Hypotese: H0: middelværdier af de 2 populationer er ens: fμ = eμ

H1: fμ < eμ 2. trin: Test statistik:

2121

222

211

21

112

)1()1(nnnn

SnSnXXt

+−+

−+−−

= (t-fordeling med 1n + 2n -2 frihedsgrader)

3. trin: Signifikansniveau: α = 0.05

Page 20: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 20

4. trin: Data: Før: 1n = 11 1X =0.78 1S =0.36 Efter: 2n = 14 2X =1.37 2S =0.87 ⇒

141

111

2141187.0)114(36.0)111(

37.178.022

+−+

−+−−

=t = -2.104

5. trin: Definer forkastelsesområdet Enkeltsidet test

104.2−=t 714.1)21411(, −=− −+αt (tabel A-2) 6. trin: Konklusion Da -2.104 < -1.714 forkastes H0 ⇒ H1 accepteres

Dvs. kvælstodindholdet forøges efter byudvikling

Page 21: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 21

Alternativt: 3. trin: Signifikansniveau: α = 0.01

104.2−=t ⇒

)21411(, −+− αt =-2.500 (tabel A-2) ⇒ H0 accepteres ⇒ Dvs. kvælstodindholdet forøges ikke efter byudvikling med et signifikansniveau på 1% OBS: ( )sander selvom forkast 00 HHP=α dvs. α større ⇒ sværere at få hypotese accepteret

(lettere at få hypotese forkastet)

Page 22: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 22

9.4 HYPOTESETEST AF VARIANSER 1. trin: Hypotese: H0: ingen signifikant forskel mellem populationens varians 2σ

og en forud valgt værdi af variansen 20σ :

2σ = 20σ

H1: 2σ < 2

0σ eller H1: 2σ > 2

0σ eller H1: 2σ ≠ 2

0σ 2. trin: Test statistik: samplevarians: 2S : 2χ (chi-fordelt – tabel A-3)

test statistik: 20

22 )1(

σχ Sn −

= 2χ -fordelt med (n-1) frihedsgrader

3. trin: Signifikansniveau: som før, typisk α = 0.01

Page 23: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 23

4. trin: Indsaml data og beregn test statistik 2χ 5. trin: Definer forkastelsesområdet Det område for test statistikken, der medfører at H0 forkastes

Page 24: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 24

6. trin: Konklusion accept område: H1 : 2σ < 2

0σ forkast hvis 2

)1(,12

−−< nαχχ H1 : 2σ > 2

0σ forkast hvis 2

)1(,2

−> nαχχ H1 : 2σ ≠ 2

0σ forkast hvis 2

)1(,2/12

−−< nαχχ eller 2)1(,2/

2−> nαχχ

Page 25: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 25

Page 26: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 26

EKSEMPEL 9-5 Variansen af betons trykstyrke bør ikke være for stor 1. trin: Hypotese: H0: varians = 2

0σ = 275.0 H1: 2σ > 2

3. trin: Signifikansniveau: α = 0.05 4. trin: Data:

n= 5 S =1.238 ⇒ 20

22 )1(

σχ Sn −

= = 84.1075.0

238.1)15(2

2

=−

5. trin: Definer forkastelsesområdet H1 : 2σ > 2

0σ forkast hvis 2)1(,

2−> nαχχ

2)1(, −nαχ =9.492 (tabel A-3)

6. trin: Konklusion Da 2

)1(,2

−> nαχχ forkastes hypotesen

Page 27: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 27

9.4.2 HYPOTESETEST AF 2 POPULATIONERS VARIANSER Varians af de 2 populationer: 2

1S og 22S ( 2

1S > 22S )

1. trin: Hypotese: H0: ingen signifikant forskel mellem populationernes varianser

21σ = 2

2σ H1: 2

1σ ≠ 22σ

2. trin:

test statistik: 22

21

SSF = F - fordelt med ( 1n -1) frihedsgrader i tæller

( 2n -1) frihedsgrader i nævner 3. trin: Signifikansniveau: typisk α = 0.01 4. trin: Indsaml data og beregn test statistik F 5. trin: Definer forkastelsesområdet H0 accepteres på signifikansniveau α hvis F < 1,1,2/ 21 −− nnFα 6. trin: Konklusion

Page 28: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 28

Page 29: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 29

EKSEMPEL 9-6 1. trin: Hypotese: H0: 2

1σ = 22σ

H1: 21σ ≠ 2

2σ 2. trin:

test statistik: 22

21

SSF =

3. trin: Signifikansniveau: typisk α = 0.05 4. trin: Indsaml data og beregn test statistik F

1n =5 21S =3.807 2n =5 2

2S =6.423

test statistik: 22

21

SSF =

807.3423.6

= =1.687

5. trin: Definer forkastelsesområdet

1,1,2/ 21 −− nnFα =6.39 (tabel A-4) 6. trin: Konklusion Da F < 1,1,2/ 21 −− nnFα accepteres H0 på signifikansniveau α =5%

Page 30: Statistik – 7. gang 1 9. HYPOTESE TEST - wind.civil.aau.dk · PDF fileTypisk vælges α = 0.01 eller 0.05 . Statistik ... (tabel A-4) 6. trin: Konklusion Da F ... Statistik – 7.

Statistik – 7. gang 30