7. přednáška

33
7. přednáška Základy testování hypotéz

description

7. přednáška. Základy testování hypotéz. Testování hypotéz. V kvantitativně orientovaných výzkumech ověřujeme hypotézy o vztazích mezi jevy – tzv. věcné hypotézy. Chlapci dosahují lepších výsledků ve fyzice než dívky. Operacionalizujeme - forma statistické hypotézy: - PowerPoint PPT Presentation

Transcript of 7. přednáška

Page 1: 7. přednáška

7. přednáška

Základy testování hypotéz

Page 2: 7. přednáška

Testování hypotéz

V kvantitativně orientovaných výzkumech ověřujeme hypotézy o vztazích mezi jevy – tzv. věcné hypotézy.

• Chlapci dosahují lepších výsledků ve fyzice než dívky. Operacionalizujeme - forma statistické hypotézy:• Průměrný počet bodů v didaktickém testu z fyziky je u

chlapců vyšší než průměrný počet bodů u dívek. Testování hypotéz - rozhodování• o platnosti nebo neplatnosti hypotézy vyslovené

na základě pozorování na výběrovém souboru• předem dané riziko omylu o pravdivosti zkoumané

hypotézy

Page 3: 7. přednáška

Nulová hypotéza

Statistickou hypotézu ověřujeme proti nulové hypotéze.

Nulová hypotéza = domněnka, která tvrdí, že mezi proměnnými, které zkoumáme, vztah není. Dokážeme-li, že nulová hypotéza neplatí, přijímáme alternativní hypotézu.

H0: Chlapci i dívky budou dosahovat v didaktickém testu z fyziky stejných výsledků.

Page 4: 7. přednáška

Co zkoumáme?

• Souvisejí spolu dané proměnné (jevy)? Jaké je riziko omylu pro přijetí této hypotézy? – statistické testy významnosti

• Jestliže spolu jevy souvisejí, jak těsný je jejich vztah (míra závislosti mezi jevy)?– koeficienty korelace, regrese, kontingence,

atd.

Page 5: 7. přednáška

Statistické testy významnosti

Existuje mezi proměnnými statisticky významný (signifikantní) vztah? (Tj. je velmi nepravděpodobné, že by vztah vznikl náhodou.)

Hladina významnosti = pravděpodobnost toho, že jsme neoprávněně odmítli nulovou hypotézu, tedy přijali hypotézu alternativní.

Možnosti H0 nezamítneme H0 zamítneme

H0 platí k chybě nedochází

chyba 1. druhu, označujeme α

H0 neplatí chyba 2. druhu, označujeme β

k chybě nedochází

Page 6: 7. přednáška

Druhy statistický testů významnosti

Týká se nulová hypotéza některého parametru rozdělení náhodné veličiny?– parametrické – vyžadují splnění řady předběžných podmínek,

např. rozdělení náhodné veličiny určitého typu (nejčastěji normální)

– neparametrické – např. když není znám typ rozdělení náhodné veličiny, jsou univerzálnější, ale mají menší schopnost rozeznat odchylky od nulové hypotézy /a mohou odmítnout nulovou hypotézu jako nesprávnou), vyžadují větší počet případů

Jak jsme formulovali alternativní hypotézu?• např. nulová hypotéza typu a = b (a, aritmetický průměr

skupiny A = b, aritmetickému průměru skupiny B); – alternativní hypotéza: a > b – jednostranné testy– alternativní hypotéza: a ≠ b – oboustranné testy

Page 7: 7. přednáška

Nominální, ordinální, kardinální?

Podle proměnných, se kterými pracujeme: • proměnné nominální (několik navzájem se

vylučujících hodnot, pracujeme většinou s jejich počty)

• proměnné ordinální (jsou nominální proměnné, u nichž hraje roli hierarchické uspořádání)

• proměnné kardinální (jsou všechny proměnné, které lze změřit)

Page 8: 7. přednáška

Analýza nominálních dat

Test dobré shody chí-kvadrát ověřujeme, zda četnosti, které byly získány měřením, se odlišují od

teoretických četností, které odpovídají dané nulové hypotéze

Test nezávislosti chí-kvadrát pro kontingenční tabulku existuje souvislost mezi dvěma (pedagogickými) jevy, které byly

zachyceny pomocí nominálního i ordinálního měření)

Test nezávislosti chí-kvadrát pro čtyřpolní tabulkupro případy, že jevy, mezi kterými ověřujeme vztah, mohou

nabývat pouze dvou altenativních kvalit

Stupeň závislosti mezi jevy při nominálním měřenínapř. koeficient kontingence

Page 9: 7. přednáška

Příklad - test dobré shody Chí-kvadrát (χ²)

V určitém roce zemřelo v ČR na následky dopravních nehod 114 dětí. Tato úmrtí byla rozdělena do jednotlivých měsíců roku tak, jak uvádí tabulka. Je počet úmrtí ve všech měsících stejný?

• H0 Počty úmrtí dětí při dopravních nehodách jsou v jednotlivých měsících roku stejné.

• HA Počty úmrtí dětí při dopravních nehodách se v jednotlivých měsících roku liší.

Příklad převzat z Chráska, 2007

Page 10: 7. přednáška

Měsíc Pozorovaná četnost

P

Očekávaná četnost

O

P – O (P – O)2

leden 7

únor 7

březen 8

duben 10

květen 10

červen 9

červenec 14

srpen 12

září 10

říjen 12

listopad 7

prosinec 8

∑ 114

O

OP 2)(

O

OP 22 )(

Page 11: 7. přednáška

Postup při testování statistické hypotézy:

1. Stanovte druh testu2. Zformulujte nulovou a alternativní hypotézu 3. Uveďte testové kritérium a stanovte počet stupňů

volnosti - uvést vzorec4. Vypočtěte testové kritérium5. Nalezněte tabulkové hodnoty6. Porovnejte vypočtené testové kritérium s tabulkovou

hodnotou7. Rozhodněte o nulové hypotéze8. Zformulujte závěrečný výrok

Page 12: 7. přednáška

Měsíc Pozorovaná četnost

P

Očekávaná četnost

O

P – O (P – O)2

leden 7 9,5

únor 7 9,5

březen 8 9,5

duben 10 9,5

květen 10 9,5

červen 9 9,5

červenec 14 9,5

srpen 12 9,5

září 10 9,5

říjen 12 9,5

listopad 7 9,5

prosinec 8 9,5

∑ 114 114

O

OP 2)(

O

OP 22 )(

Page 13: 7. přednáška

Měsíc Pozorovaná četnost

P

Očekávaná četnost

O

P – O (P – O)2

leden 7 9,5 -2,5

únor 7 9,5 -2,5

březen 8 9,5 -1,5

duben 10 9,5 0,5

květen 10 9,5 0,5

červen 9 9,5 -0,5

červenec 14 9,5 4,5

srpen 12 9,5 2,5

září 10 9,5 0,5

říjen 12 9,5 2,5

listopad 7 9,5 -2,5

prosinec 8 9,5 -1,5

∑ 114 114

O

OP 2)(

O

OP 22 )(

Page 14: 7. přednáška

měsíc Pozorovaná četnost

P

Očekávaná četnost

O

P – O (P – O)2

leden 7 9,5 -2,5 6,25

únor 7 9,5 -2,5 6,25

březen 8 9,5 -1,5 2,25

duben 10 9,5 0,5 0,25

květen 10 9,5 0,5 0,25

červen 9 9,5 -0,5 0,25

červenec 14 9,5 4,5 20,25

srpen 12 9,5 2,5 6,25

září 10 9,5 0,5 0,25

říjen 12 9,5 2,5 6,25

listopad 7 9,5 -2,5 6,25

prosinec 8 9,5 -1,5 2,25

∑ 114 114

O

OP 2)(

O

OP 22 )(

Page 15: 7. přednáška

Měsíc Pozorovaná četnost

P

Očekávaná četnost

O

P – O (P – O)2

leden 7 9,5 -2,5 6,25 0,658

únor 7 9,5 -2,5 6,25 0,658

březen 8 9,5 -1,5 2,25 0,237

duben 10 9,5 0,5 0,25 0,026

květen 10 9,5 0,5 0,25 0,026

červen 9 9,5 -0,5 0,25 0,026

červenec 14 9,5 4,5 20,25 2,132

srpen 12 9,5 2,5 6,25 0,658

září 10 9,5 0,5 0,25 0,026

říjen 12 9,5 2,5 6,25 0,658

listopad 7 9,5 -2,5 6,25 0,658

prosinec 8 9,5 -1,5 2,25 0,237

∑ 114 114 6,000

O

OP 2)(

O

OP 22 )(

Page 16: 7. přednáška

Co jsme vypočítali? Vypočítaná hodnota χ2 je 6,000. Ukazuje rozdíl mezi pozorovanou a

očekávanou četností.Při rozhodování o platnosti nulové hypotézy porovnáváme vypočítanou

hodnotu testového kritéria s tzv. kritickou hodnotou. Příslušnou hodnotu hledáme v tabulkách• na zvolené hladině významnosti (pravděpodobnost nesprávného

odmítnutí nulové hypotézy) – volíme podle situace• pro určitý počet stupňů volnosti = počet řádků v tabulce, kterým je

možné teoreticky přiřknout libovolnou hodnotu (11 stupňů volnosti v našem případě)

V tabulkách – kritická hodnota pro hladinu významnosti 0,05 a 11 stupňů volnosti je 19,675, to je větší než vypočítaná hodnota.

H0 nelze odmítnout. H0 Počty úmrtí dětí při dopravních nehodách jsou v jednotlivých

měsících roku stejné.

Page 17: 7. přednáška

Nová formulace hypotéz?

O

OP 2)(

Měsíc Pozorovaná četnost

P

Očekávaná četnost

O

P – O (P – O)2

leden 7 9,5 -2,5 6,25 0,658

únor 7 9,5 -2,5 6,25 0,658

březen 8 9,5 -1,5 2,25 0,237

duben 10 9,5 0,5 0,25 0,026

květen 10 9,5 0,5 0,25 0,026

červen 9 9,5 -0,5 0,25 0,026

červenec 14 9,5 4,5 20,25 2,132

srpen 12 9,5 2,5 6,25 0,658

září 10 9,5 0,5 0,25 0,026

říjen 12 9,5 2,5 6,25 0,658

listopad 7 9,5 -2,5 6,25 0,658

prosinec 8 9,5 -1,5 2,25 0,237

∑ 114 114 6,000

O

OP 22 )(

O

OP 2)(

Page 18: 7. přednáška

Nová formulace

H0 Počty úmrtí dětí při dopravních nehodách v období od dubna do října jsou stejně velké jako četnosti úmrtí ve zbývajících měsících roku.

HA Počty úmrtí dětí při dopravních nehodách v období od dubna do října jsou větší než četnosti úmrtí ve zbývajících měsících roku.

Měsíc Pozorovaná četnost

P

Očekávaná četnost

O

P – O (P – O)2

duben - říjen

77 66,5 10,5 110,25 1,658

listopad - březen

37 47,5 -10,5 110,25 2,321

∑ 114 114 3,979

O

OP 22 )(

O

OP 2)(

Page 19: 7. přednáška

Co nám vyšlo?H0 Počty úmrtí dětí při dopravních nehodách v období od dubna do října jsou stejně velké

jako četnosti úmrtí ve zbývajících měsících roku. HA Počty úmrtí dětí při dopravních nehodách v období od dubna do října jsou větší než

četnosti úmrtí ve zbývajících měsících roku.

Tabulka četností má 1 stupeň volnosti; kritická hodnota pro hladinu významnosti 0,05 je 3,841.

Odmítáme nulovou hypotézu a přijímáme hypotézu alternativní.

Měsíc Pozorovaná četnost

P

Očekávaná četnost

O

P – O (P – O)2

duben - říjen

77 66,5 10,5 110,25 1,658

listopad - březen

37 47,5 -10,5 110,25 2,321

∑ 114 114 3,979

O

OP 22 )(

O

OP 2)(

Page 20: 7. přednáška

Co nám vyšlo?

HA Počty úmrtí dětí při dopravních nehodách v období od dubna do října jsou větší než četnosti úmrtí ve zbývajících měsících roku.

Tabulka četností má 1 stupeň volnosti; kritická hodnota pro hladinu významnosti 0,05 je 3,841.

Odmítáme nulovou hypotézu a přijímáme hypotézu alternativní.

Měsíc Pozorovaná četnost

P

Očekávaná četnost

O

P – O (P – O)2

duben - říjen

77 66,5 10,5 110,25 1,658

listopad - březen

37 47,5 -10,5 110,25 2,321

∑ 114 114 3,979

O

OP 22 )(

O

OP 2)(

Page 21: 7. přednáška

Test nezávislosti chí-kvadrát pro kontingenční tabulku

Existuje souvislost mezi dvěma pedagogickými jevy, které byly zachyceny pomocí nominálního (i ordinálního) měření?

Časté při zpracování výsledků dotazníkových šetření.

Page 22: 7. přednáška

Jak se studuje na koleji?

Příklad:Skupině 400 vybraných studentů byl předložen dotazník, ve kterém

byly mimo jiné dvě otázky:• Byl(a) jste ubytován(a) na kolejích? A Ano B Ne• Jaký byl Váš průměrný prospěch v loňském studijním roce?

– A lepší než 1,6– B 1,6 – 2,1– C horší než 2,1

Existuje vztah mezi tím, zda studenti bydlí na kolejích, a tím, jakých studijních výsledků dosahují?

H0 Mezi četnostmi odpovědí na obě uvedené otázky není závislost.HA Mezi odpověďmi respondentů na uvedené otázky je závislost. Zvolená hladina významnosti α = 0,05.

(Chráska 2007)

Page 23: 7. přednáška

Jak se studuje na koleji?

A

lepší než 1,6

B

1,6 – 2,1

C

horší než 2,1

bydlel(a) na koleji

39 107 93 239

nebydlel(a) na koleji

41 73 47 161

∑ 80 180 140 400

Page 24: 7. přednáška

Jak se studuje na koleji?

A

lepší než 1,6

B

1,6 – 2,1

C

horší než 2,1

bydlel(a) na koleji

39 (47,8) 107 93 239

nebydlel(a) na koleji

41 73 47 161

∑ 80 180 140 400

8,47400

23980

O

O

OP 22 )(

Page 25: 7. přednáška

Jak se studuje na koleji?

A

lepší než 1,6

B

1,6 – 2,1

C

horší než 2,1

bydlel(a) na koleji

39 (47,8)

107 (107,55)

93 (83,65) 239

nebydlel(a) na koleji

41 (32,2) 73 (72,45) 47 (56,35) 161

∑ 80 180 140 400

Page 26: 7. přednáška

Jak se studuje na koleji?

A

lepší než 1,6

B

1,6 – 2,1

C

horší než 2,1

bydlel(a) na koleji

39 (47,8)

1,620

107 (107,55)

0,003

93 (83,65)

1,045

239

nebydlel(a) na koleji

41 (32,2)

2,405

73 (72,45)

0,004

47 (56,35)

1,551

161

∑ 80 180 140 400

χ² = 6,628Počet stupňů volnosti: počet řádků zmenšený o jednu * počet sloupců

zmenšený o jednu = 1 *2 = 2Kritická hodnota na hladině významnosti 0,05 při dvou stupních volnosti je

5,991. Naše hodnota ji překračuje ► nulovou hypotézu zamítneme.

Existuje souvislost mezi bydlením (nebydlením) na kolejích a studijními výsledky studentů.

O

OP 22 )(

Page 27: 7. přednáška

Kouří více studentů než studentek?

Test nezávislostí chí-kvadrát pro čtyřpolní tabulku• zvláštní případ kontingenční tabulky se dvěma řádky a dvěma

sloupci. Příklad:Náhodně vybraným vysokoškolským studentům (12 mužů a 36 žen)

byla položena otázka, zda kouří. Na základě dat máme rozhodnout, zda studenti kouří častěji než studentky. Výsledky jsou v tabulce.

kouří nekouří ∑

muži 11 1 12

ženy 15 21 36

∑ 26 22 48

Page 28: 7. přednáška

Kouří více studentů než studentek?

H0 Frekvence kouření je u mužů i žen stejně velká.

HA Frekvence kouření je u mužů a žen rozdílná.

Zvolená hladina významnosti 0,01.

kouří nekouří ∑

muži 11 1 12

ženy 15 21 36

∑ 26 22 48

))()()((

)( 22

dcdbcaba

bcadn

kouří nekouří ∑

muži a b a+b

ženy c d c+d

∑ a+c b+d n

Page 29: 7. přednáška

Kouří více studentů než studentek?

H0 Frekvence kouření je u mužů i žen stejně velká.

HA Frekvence kouření je u mužů a žen rozdílná.

Zvolená hladina významnosti 0,01.

kouří nekouří ∑

muži 11 1 12

ženy 15 21 36

∑ 26 22 48

))()()((

)( 22

dcdbcaba

bcadn

kouří nekouří ∑

muži a b a+b

ženy c d c+d

∑ a+c b+d n

χ² = 9,063; tabulková hodnota při jednom stupni volnosti na hladině významnosti 0,01 = 6,635.

Naměřená hodnota ji překračuje.

Page 30: 7. přednáška

Kouří více studentů než studentek?

H0 Frekvence kouření je u mužů i žen stejně velká.

HA Frekvence kouření je u mužů a žen rozdílná.

Zvolená hladina významnosti 0,01.

kouří nekouří ∑

muži 11 1 12

ženy 15 21 36

∑ 26 22 48

))()()((

)( 22

dcdbcaba

bcadn

kouří nekouří ∑

muži a b a+b

ženy c d c+d

∑ a+c b+d n

χ² = 9,063; tabulková hodnota při jednom stupni volnosti na hladině významnosti 0,01 = 6,635. Naměřená hodnota ji překračuje.

Frekvence kouření u mužů a žen je rozdílná.

Page 31: 7. přednáška

Co znamená hladina významnosti?

Pro pravděpodobnost chyby 1. druhu (hladinu významnosti) požadujeme, aby nepřekročila předem dané číslo α blízké nule (zpravidla α = 0,05 nebo 0,01). Říkáme, že H0 byla či nebyla zamítnuta na hladině významnosti α.

Pokud zvolíme hladinu významnosti 0,05 (jinak zapsáno 5%), pak v 5 případech ze sta zamítáme statistickým testem hypotézu H0, která je platná a zamítnuta být neměla. S pravděpodobností 95% jsme tedy učinili správné rozhodnutí.

• V případě, kdy H0 nezamítáme, vyslovíme se o ní neurčitě a řekneme, že nezamítáme H0 na hladině významnosti α. Netvrdíme, že hypotézu H0 přijímáme!!

Možnosti H0 nezamítneme H0 zamítneme

H0 platí k chybě nedochází

chyba 1. druhu, označujeme α

H0 neplatí chyba 2. druhu, označujeme β

k chybě nedochází

Page 32: 7. přednáška

Stupeň závislosti mezi jevy

Pomocí testu chí-kvadrát ►existence závislosti mezi dvěma pedagogickými jevy.

K posouzení stupně závislosti mezi jevy existují různé koeficienty: koeficient kontingence C, Čuprův koeficient, atd.

Koeficient kontingence C C nabývá hodnot 0 - 1; čím vyšší hodnota, tím vyšší stupeň

závislosti. !Ale dva koeficienty nelze srovnávat, pokud tabulky nemají

stejný počet řádků a sloupců! Částečně odstraníme výpočtem normovaného koeficientu kontingence.

2

2

n

C

r

rC

1max

maxC

CCnorm

Page 33: 7. přednáška

Stupeň závislosti mezi jevy

Příklad: Jak se studuje na koleji?Vypočítaná hodnota χ²= 6,628Závěr: vztah mezi oběma proměnnými (prospěch,

bydlení na koleji) není příliš těsný.

2

2

n

C

r

rC

1max

maxC

CCnorm

181,0

2

12628,6400

628,6

normC