Verklarende Statistiek: Toetsen

15
Verklarende Statistiek: Toetsen Zat ik nou in dat kritische gebied of niet?

Transcript of Verklarende Statistiek: Toetsen

Page 1: Verklarende Statistiek: Toetsen

Verklarende Statistiek:Toetsen

Zat ik nou in dat kritische gebied of

niet?

Page 2: Verklarende Statistiek: Toetsen

Toetsen, Overzicht

Nulhypothese - Alternatieve hypothese(voorbeeld: toets voor p = po in binomiale steekproef)

Betrouwbaarheid en significantieniveauEenzijdig of tweezijdig toetsenProcedure - BeslisregelOverschrijdingskans

Page 3: Verklarende Statistiek: Toetsen

Nulhypothese- Alternatieve HypotheseNulhypothese Ho:

De hypothese die we met een toets, uitgevoerd op een steekproef, proberen te verwerpen.

Als dat lukt gaan we over op de Alternatieve hypothese H1

H1: Er zijn NIET evenveel mannelijke als vrouwelijke biologie studenten

Ho: Er zijn evenveel mannelijke als vrouwelijke biologie studenten

Page 4: Verklarende Statistiek: Toetsen

We plannen een steekproef ....

H1: De kans dat een willekeurig gekozen biologiestudent een man is, is NIET 0.5

Ho: De kans dat een willekeurig gekozen biologiestudent een man is, is 0.5

De nul- en alternatieve hypothesen, Ho en H1, zeggen iets over een parameter van de kansverdeling van de variabele die we meten.

Het kiezen van een nulhypothese

•Ho en H1 zijn disjunct

De formulering is belangrijk en  moet precies zijn.

Page 5: Verklarende Statistiek: Toetsen

α heet significantienivo(1−α ) heet betrouwbaarheid

We verwerpen de hulhypothese wel als de kans op de gevonden toetsingsgrootheid, of een waarde die nog verder in de staart(en) van de kansverdeling ligt, kleiner is dan α.

... en we bedenken een toetsingsgrootheid: dwz. een, informatief gekozen, kansvariabele te berekenen uit de steekproefgegevens.

We kunnen dan de kans-verdeling van die toetsings-grootheid bepalen, onder de aanname dat H0 waar is:

Betrouwbaarheid en significantienivo

acceptatiegebied

35 40 45 50 55 60 65 700.020.040.060.080.1

kritische gebied

Page 6: Verklarende Statistiek: Toetsen

α heet significantienivo(1−α ) heet betrouwbaarheid

We verwerpen de hulhypothese wel als de kans op de gevonden toetsingsgrootheid, of een waarde die nog verder in de staart(en) van de kansverdeling ligt, kleiner is dan α.

... en we bedenken een toetsingsgrootheid: dwz. een, informatief gekozen, kansvariabele te berekenen uit de steekproefgegevens.

We kunnen dan de kans-verdeling van die toetsings-grootheid bepalen, onder de aanname dat H0 waar is:

Betrouwbaarheid en significantienivo

acceptatiegebied

35 40 45 50 55 60 65 700.020.040.060.080.1

kritische gebied

(1−α )-voorspellingsinterval

Page 7: Verklarende Statistiek: Toetsen

α heet significantienivo(1−α ) heet betrouwbaarheid

We verwerpen de hulhypothese wel als de kans op de gevonden toetsingsgrootheid, of een waarde die nog verder in de staart(en) van de kansverdeling ligt, kleiner is dan α.

... en we bedenken een toetsingsgrootheid: dwz. een, informatief gekozen, kansvariabele te berekenen uit de steekproefgegevens.

We kunnen dan de kans-verdeling van die toetsings-grootheid bepalen, onder de aanname dat H0 waar is:

Betrouwbaarheid en significantienivo

acceptatiegebied

35 40 45 50 55 60 65 700.020.040.060.080.1

kritische gebied

We verwerpen de nulhypothese niet als de gevonden toetsingsgrootheid in het (1−α)-voorspellingsinterval ligt.

(1−α )-voorspellingsinterval

Page 8: Verklarende Statistiek: Toetsen

Eenzijdig of tweezijdig toetsenTweezijdig toetsen:

De waarden die voldoen aan de alternatieve hypothese kunnen zowel groter als kleiner zijn dan die van de

nulhypothese

Ho : θ = θo H1 : θ ≠ θo

Tweezijdig:

Ho: θ ≤ θo

H1: θ > θo

Ho samengesteld:

Eenzijdig toetsen:

De waarden die voldoen aan de alternatieve hypothese zijn altijd

groter (of altijd kleiner) dan die van de nulhypothese

Eenzijdig:

Ho: θ = θo

H1: θ > θo

Ho enkelvoudig:

Page 9: Verklarende Statistiek: Toetsen

Ho: p ≤ 0.5

Ho: p = 0.5

Eenzijdig:

H1: De kans dat een willekeurig gekozen biologiestudent een man is, is groter dan 0.5

Ho: De kans dat een willekeurig gekozen biologiestudent een man is, is kleiner dan 0.5

H1: De kans dat een willekeurig gekozen biologiestudent een man is, is N IET 0.5

Ho: De kans dat een willekeurig gekozen biologiestudent een man is, is 0.5

Tweezijdig:

H1: p ≠ 0.5

H1: p > 0.5

Page 10: Verklarende Statistiek: Toetsen

Tweezijdige toets:

Ho: De kans dat een willekeurig gekozen student een man is, is 0.5.

H1: De kans dat een willekeurige student een man is, is NIET 0.5.

We toetsen aan het aantal mannen in een steekproef: k.

betrouwbaarheid 1- α is 0.95, significantieniveau α is 0.05.

We kiezen willekeurig 100 studenten: 66 vrouwen en 34 mannen.

De toetsingsgrootheid heeft dus de waarde 34.

Als Ho juist is geldt k ~ B (100, 0.5), E (k) = 50, Var(k) = 25.

We gebruiken een benadering van k met x ~ N (50, 5).

Page 11: Verklarende Statistiek: Toetsen

f (x)

x

E (x) = 50

Var(x) = 25

35 40 45 50 55 60 65 70

0.020.040.060.080.1

P (toetsingsgrootheid in het kritisch gebied | Ho) ≤ α

Als Ho waar is, valt de toetsingsgrootheid met kans 1-α = 0.95 in het voorspellingsinterval.

P ( 50 - 1.96 × 5 < x < 50 + 1.96 × 5 ) = 0.95

P ( 40.2 < x < 59.8 ) = 0.95

De waarden van x buiten het voorspellingsinterval [40.2, 59.8] vormen het kritisch gebied.

Page 12: Verklarende Statistiek: Toetsen

x

Rechts-Eenzijdige toets Ho: p ≤ 0.5

Verwerp Ho

P (x > 58.2) = 0.05

Aanvaard Ho

f (x)

35 40 45 50 55 60 65 700.020.040.060.080.1

f (x)

x

Tweezijdige toets Ho: p = 0.5

Aanvaard HoVerwerp Ho

P (x > 59.8) = 0.025

Verwerp Ho

P (x < 40.2 = 0.025)

35 40 45 50 55 60 65 700.020.040.060.080.1

0 1

Ho H1

voordeel van de twijfel: bereken met p = 0.5

0.5

Page 13: Verklarende Statistiek: Toetsen

P (40.2 < x < 59.8 ) = 0.95

35 40 45 50 55 60 65 700.020.040.060.080.1

terug naar de discrete verdeling van k

(met conservatieve continuiteitscorrectie):

P (39 < k < 61 ) ≥ 0.95

59.8

58 59 60 61 62 63 6437 38 39 40 41 42 43

40.2

Kritisch gebied: k ≤ 39 en k ≥ 61 . De toetsingsgrootheid k = 34 ligt in dit gebied.Ho wordt verworpen: p is NIET 0.5. Er zijn niet evenveel mannelijke als vrouwelijke biologiestudenten.

Page 14: Verklarende Statistiek: Toetsen

Procedure - Beslisregel1a) Stel nul - en alternatieve hypothese op (kies 1- of 2-zijdige test).

1b) kies de toetsingsgrootheid en significantieniveau α ( in de meeste gevallen wordt α = 0.05 gekozen).

2) Neem een steekproef.

3a) Bereken de toetsingsgrootheid.

3b) Bereken een voorspellingsinterval en een kritisch gebied voor de toetsingsgrootheid op basis van α en Ho.P (toetsingsgrootheid in het kritisch gebied | Ho) ≤ α.

4) Kijk of de toetsingsgrootheid in het kritisch gebied dan wel het voorspellingsinterval ligt.

•Als we α kleiner kiezen krimpt het kritische gebied.• Kritisch gebied zit vast aan de staarten van de kansverdeling voor θ=θo.

Page 15: Verklarende Statistiek: Toetsen

Overschrijdingskans3b) Als Ho waar is, valt de toetsingsgrootheid minstens met kans

1-α = 0.95 in het voorspellingsinterval.

Als de overschrijdingskans kleiner is dan het significantieniveau, verwerp je Ho

Andere aanpak:Bereken de kans, onder Ho, dat de toetsingsgrootheid x de

gevonden waarde x, dan wel een extremere waarde aanneemt:

de overschrijdingskans of p-waarde

rechtseenzijdige toets: p = P (x ≥ x | Ho)

linkseenzijdige toets: p = P (x ≤ x | Ho)

tweezijdige toets: p = 2 × Min[ P (x ≤ x | Ho) , P (x ≥ x | Ho) ]