Post on 08-Jun-2019
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
toetsende statistiek
week 1: kansen en random variabelenweek 2: de steekproevenverdelingweek 3: schatten en toetsen: de z-toets
week 4: het toetsen van gemiddelden: de t-toets
Moore, McCabe, and Craig. Introduction to the Practice of Statistics
Chapter 7: Inference for Distributions
7.1: Inference for the Mean of a Population
7.2: Comparing Two Means
week 5: het toetsen van varianties: de F-toetsweek 6: het toetsen van tellingen: de χ2-toetsweek 7: verdelingsvrije toetsen
Frank Busing, Universiteit Leiden1 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
deze week: wat hebben we al geleerd?
de one-sample z-toets
verschillende alternatieve hypothese vormen: 1- (links of rechts) en 2-zijdig
de relatie tussen toetsstatistiek en steekproevenverdeling van een statistiek
de criterium waarde voor α (α = 0.05)
de relatie tussen z en p tegenover z∗ en α
kennis en begrip van het betrouwbaarheidsinterval
de relatie tussen betrouwbaarheidsinterval en 2-zijdig toetsen
2 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
toetsen van gemiddelde
een tekortkoming van de z-test isdat we de standaarddeviatie van de populatie σ moeten wetenom de standaarddeviatie van de steekproevenverdeling σ/
√n uit te rekenen
echter, in de praktijk is σ meestal onbekend
we kunnen dus geen z =x− µ
σ/√n
uitrekenen, maar wel t =x− µ
s/√n
we schatten de standaarddeviatie van de populatie σ
met de standaarddeviatie van de steekproef sduswe schatten de standaarddeviatie van de steekproevenverdeling van x, σ/
√n
met de standaardfout voor het gemiddelde van de steekproef1
SEx =s√n
de standaardfout wordt doorgaans aangeduid met SE, afkorting voor standard error
3 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
t-verdeling familie
het schatten van de standaarddeviatie van x met de standaardfout SEx = s/√n
gaat beter voor een grotere n (denk aan de wet van de grote getallen)
naarmate n groter wordt, wordt s een betrouwbaardere schatter van σ
tot die tijd gebruiken we een andere steekproevenverdeling van x: de t-verdeling
de t-verdeling is eigenlijk een hele familie van verdelingenelke lid van de familie wordt aangeduid met zijn vrijheidsgraden: df2
voor elke aantal vrijheidsgraden is er een aparte t-verdelinghet aantal vrijheidsgraden hangt af van steekproefgrootte n
df = degrees of freedom4 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
t-verdeling versus standaard normaal
1 t-verdeling is afhankelijk van het aantal vrijheidsgraden (df)2 door de dikkere staart (bij kleine df) is de t-toets convervatiever3 als df → ∞ dan t(df) → N(0, 1)
5 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
t-tabel
Probability p
t*
Table entry for p and C is
the critical value t* with
probability p lying to its
right and probability C lying
between − t* and t* .
T A B L E D
t distribution critical values
Upper-tail probability p
df .25 .20 .15 .10 .05 .025 .02 .01 .005 .0025 .001 .0005
1 1.000 1.376 1.963 3.078 6.314 12.71 15.89 31.82 63.66 127.3 318.3 636.6
2 0.816 1.061 1.386 1.886 2.920 4.303 4.849 6.965 9.925 14.09 22.33 31.60
3 0.765 0.978 1.250 1.638 2.353 3.182 3.482 4.541 5.841 7.453 10.21 12.92
4 0.741 0.941 1.190 1.533 2.132 2.776 2.999 3.747 4.604 5.598 7.173 8.610
5 0.727 0.920 1.156 1.476 2.015 2.571 2.757 3.365 4.032 4.773 5.893 6.8696 0.718 0.906 1.134 1.440 1.943 2.447 2.612 3.143 3.707 4.317 5.208 5.9597 0.711 0.896 1.119 1.415 1.895 2.365 2.517 2.998 3.499 4.029 4.785 5.408
6 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
t-tabel
T A B L E D
t distribution critical values
Upper-tail probability p
df .25 .20 .15 .10 .05 .025 .02 .01 .005 .0025 .001 .0005
1 1.000 1.376 1.963 3.078 6.314 12.71 15.89 31.82 63.66 127.3 318.3 636.6
2 0.816 1.061 1.386 1.886 2.920 4.303 4.849 6.965 9.925 14.09 22.33 31.60
3 0.765 0.978 1.250 1.638 2.353 3.182 3.482 4.541 5.841 7.453 10.21 12.92
4 0.741 0.941 1.190 1.533 2.132 2.776 2.999 3.747 4.604 5.598 7.173 8.610
5 0.727 0.920 1.156 1.476 2.015 2.571 2.757 3.365 4.032 4.773 5.893 6.8696 0.718 0.906 1.134 1.440 1.943 2.447 2.612 3.143 3.707 4.317 5.208 5.9597 0.711 0.896 1.119 1.415 1.895 2.365 2.517 2.998 3.499 4.029 4.785 5.408
28 0.683 0.855 1.056 1.313 1.701 2.048 2.154 2.467 2.763 3.047 3.408 3.67429 0.683 0.854 1.055 1.311 1.699 2.045 2.150 2.462 2.756 3.038 3.396 3.65930 0.683 0.854 1.055 1.310 1.697 2.042 2.147 2.457 2.750 3.030 3.385 3.646
40 0.681 0.851 1.050 1.303 1.684 2.021 2.123 2.423 2.704 2.971 3.307 3.551
50 0.679 0.849 1.047 1.299 1.676 2.009 2.109 2.403 2.678 2.937 3.261 3.496
60 0.679 0.848 1.045 1.296 1.671 2.000 2.099 2.390 2.660 2.915 3.232 3.460
80 0.678 0.846 1.043 1.292 1.664 1.990 2.088 2.374 2.639 2.887 3.195 3.416
100 0.677 0.845 1.042 1.290 1.660 1.984 2.081 2.364 2.626 2.871 3.174 3.390
1000 0.675 0.842 1.037 1.282 1.646 1.962 2.056 2.330 2.581 2.813 3.098 3.300
z* 0.674 0.841 1.036 1.282 1.645 1.960 2.054 2.326 2.576 2.807 3.091 3.291
50% 60% 70% 80% 90% 95% 96% 98% 99% 99.5% 99.8% 99.9%
Confidence level C
7 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
de one-sample t-toets
het toetsen van een gemiddelde met de t-toets
andere steekproefgegevens: n = 10, x = 9.45 en s = 0.6996
stappenplan one-sample t-toets:
1 hypothese H0 : µ = 9 en Ha : µ 6= 92 steekproevenverdeling t verdeeld met df = n− 1 = 10− 1 = 93 toetsingsgrootheid t = (x− µ)/(s/
√n) = (9.45− 9)/0.2212 = 2.034
4 verwerpingsgebied α = 0.05,df = 9, t∗ = 2.262 (kolom α = 0.025)5 statistische conclusie t = 2.034 < 2.262 = t∗ en H0 wordt niet verworpen6 inhoudelijke conclusie eekhoorns verzamelen evenveel voedsel na onthouding
merk op dat deze tweezijdige toetsing H0 niet verwerptmaar dat een eenzijdige toetsing dat wel gedaan zou hebbenwant t∗ = 1.833 voor α = 0.05 en t = 2.034 ligt verder van nul
8 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
SPSS: one-sample t-test results
One-Sample Statistics
N Mean Std. Deviation
Std. Error
Mean
grams 10 9.450 .6996 .2212
One-Sample Test
Test Value = 9
t df Sig. (2-tailed)
Mean
Difference
95% Confidence Interval
of the Difference
Lower Upper
grams 2.034 9 .072 .4500 -.050 .950
(9.450-9)/0.2212
0.6996/√10
“Gemiddeld genomen verzamelen uitgehongerde eekhoorns (M=9.45, SE=.2212)niet meer of minder dan 9 gram voedsel, t(9) = 2.034,p = .072.”
9 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
conclusie one-sample t-toets
de one-sample t-toets is gelijk aan de one-sample z-toets
behalve dat de standaarddeviatie van de populatie σ
geschat wordt met de standaarddeviatie van de steekproef sen de standaarddeviatie van de steekproevenverdeling van x met SEx = s/
√n
en dat daardoor de standaard normaal verdeling N(0, 1)vervangen wordt door de t-verdeling t(df)
10 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
voorbeeld
– we verzamelen 12 proefpersonen met extreme angst voor spinnen– elke proefpersoon krijgt een echte spin te zien en dezelfde spin op een foto– we meten de angst van de proefpersoon na elke spin (twee momenten)– de onderzoeker verwacht meer angst voor de echte spin dan voor de foto ervan3
uit: William Wallace Denslow (1902). Denslow’s Mother Goose.11 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
verschilscores
twee afhankelijke observaties kunnen worden verkregen
1 per paar, gepaard op bepaalde eigenschappenbijvoorbeeld: medicijn met controle op sexe en leeftijd
2 per persoon, gemeten op verschillende momentenbijvoorbeeld: vooruitgang studenten bij toetsende statistiek
in het spinnen-angst-voorbeeld zijn twee gepaarde observaties:de foto- en de echte spinnenangst van een en dezelfde proefpersoon
het verschil tussen de twee metingen wordt getoetst
er wordt dus eerst een verschilscore bepaald: di = xi1 − xi2 (echt - foto)vervolgens wordt er een one-sample t-toets uitgevoerd op de verschilscores d
de µ onder H0 is (meestal) nul, dus H0 : µ = µ1 − µ2 = 0 ofwel H0 : µ1 = µ2
12 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
de t-toets voor afhankelijke steekproeven
het toetsen van twee gemiddelden uit twee afhankelijk steekproeven
steekproefgegevens: n = 12, d = 7.0 en s = 9.807
stappenplan paired-samples t-toets:4
1 hypothese H0 : µ = 0 en Ha : µ > 02 steekproevenverdeling t verdeeld met df = n− 1 = 11
3 toetsingsgrootheid t = d/(s/√n) = 7.0/(9.807/3.464) = 2.473
4 verwerpingsgebied α = 0.05,df = 11, t∗ = 2.2015 statistische conclusie t = 2.473 > 2.201 = t∗ en H0 wordt verworpen6 inhoudelijke conclusie er is een verschil:
een echte spin geeft meer angst dan een foto ervan
paired-samples t-toets = dependent-samples t-toets13 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
SPSS: one-sample t-test results
One-Sample Statistics
N Mean Std. Deviation
Std. Error
Mean
diff 12 7.0000 9.80723 2.83110
One-Sample Test
Test Value = 0
t df
Sig. (2-
tailed)
Mean
Difference
95% Confidence
Interval of the
Difference
Lower Upper
diff 2.47 11 .031 7.00000 .7688 13.2312
9.80723/√12
(7.0000-0)/2.83110
merk op dat SPSS de p-waarde geeft voor tweezijdige toetsing: Sig. (2-tailed)voor eenzijdige toetsing deel je deze waarde door 2: 0.031/2 = 0.015
14 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
SPSS: paired-samples t-test results
Paired Samples Statistics
Mean N Std. Deviation
Std. Error
Mean
Pair 1 real
picture
47.00 12 11.02889 3.18377
40.00 12 9.293 2.683
Paired Samples Test
Paired Differences
t df
Sig. (2-
tailed)Mean
Std.
Deviation
Std.
Error
Mean
95% Confidence
Interval of the
Difference
Lower Upper
Pair 1 real - picture 7.00000 9.80723 2.83110 .76878 13.23 2.473 11 .031
(47.00-40.00)/2.831109.80723/√12
“Gemiddeld genomen ervaren proefpersonen significant meer angstvoor echte spinnen (M = 47.00, SE = 3.18)dan voor foto’s van spinnen (M = 40.00, SE = 2.68), t(11) = 2.473,p = .015.”
15 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
twee onafhankelijke steekproeven
twee situaties waarin twee onafhankelijke steekproeven ontstaan:
1 vanuit 1 populatie (bijvoorbeeld de studenten populatie):
verzamel een aantal proefpersonen
verdeel de proefpersonen at random over twee groepen
geef elke groep zijn eigen interventiemeet het gemiddelde voor elke groep
toets het verschil in gemiddelden
2 vanuit 2 populaties (bijvoorbeeld een mannen en vrouwen populatie):
trek twee random steekproeven, een uit elke populatie
meet het gemiddelde voor elke groep
toets het verschil in gemiddelden
16 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
two-samples t-toets
de toetsstatistiek voor 2 onafhankelijke steekproeven is
t-toetsstatistiek
t =x1 − x2 − (µ1 − µ2)
standaardfout
het verschil tussen de steekproefgemiddelden x1 − x2wordt vergeleken methet te verwachten verschil tussen de populatiegemiddelden µ1 − µ2 onder H0
de nul hypothese is meestal H0 : µ1 = µ2, zodat (µ1 − µ2) wegvalt
de standaardfout is een verhaal apart
17 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
standaardfout indien σ1 6= σ2
als σ1 en σ2 niet ongeveer gelijk zijn(vuistregel: σ1 6= σ2 als s1 en s2 meer dan factor 2 van elkaar verschillen)dan is de standaardfout van de steekproevenverdeling van x1 − x2
standaardfout indien σ1 6= σ2
SEx1−x2=
√
s21n1
+s22n2
begrip: de variantie van het verschil
1 tussen 2 observaties is σ21 plus σ2
2
2 tussen de som van n1 plus n2 observaties is n1σ21 plus n2σ
22
3 tussen de gemiddelden is dan σ21/n1 plus σ2
2/n2
het aantal vrijheidsgraden is hier (conservatief) df = min(n1 − 1,n2 − 1)dus de kleinste waarde van n1 − 1 en n2 − 16
SPSS berekent het aantal vrijheidsgraden iets nauwkeuriger (zie MM&C, p.441)18 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
standaardfout indien σ1 = σ2
als σ1 en σ2 gelijk zijn dan is de t-verdeling exacter is dan een gecombineerde schatter (pooled estimator) voor de variantie
pooled variance estimator
s2p =(n1 − 1)s21 + (n2 − 1)s22
n1 + n2 − 2
de standaardfout van de steekproevenverdeling van x1 − x2 is nu
standaardfout indien σ1 = σ2
SEx1−x2=
√
s2p
n1+
s2p
n2= sp
√
1
n1+
1
n2
het aantal vrijheidsgraden is hier df = n1 + n2 − 2
19 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
de t-toets voor onafhankelijke steekproeven
het toetsen van twee gemiddelden uit twee onafhankelijk steekproeven
steekproefgegevens:n1 = 12, x1 = 47, s1 = 11.029n2 = 12, x2 = 40, s2 = 9.293
aanname σ1 6= σ2 geeft
SEx1−x2=
√
11.0292/12+ 9.2932/12 = 4.163
stappenplan independent-samples t-toets voor σ1 6= σ2:
1 hypothese H0 : µ1 = µ2 en Ha : µ1 > µ2
2 steekproevenverdeling t verdeeld met df = 12− 1 = 113 toetsingsgrootheid t = (x1 − x2)/SE = (47− 40)/4.163 = 1.6814 verwerpingsgebied α = 0.05,df = 11, t∗ = 1.7965 statistische conclusie t = 1.681 < 1.796 = t∗ en H0 wordt niet verworpen6 inhoudelijke conclusie geen verschil tussen echte en foto spinnenangst
20 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
de t-toets voor onafhankelijke steekproeven
het toetsen van twee gemiddelden uit twee onafhankelijk steekproeven
steekproefgegevens:n1 = 12, x1 = 47, s1 = 11.029n2 = 12, x2 = 40, s2 = 9.293
aanname σ1 = σ2 geeft
s2p = (11× 11.0292 + 11× 9.2932)/22 = 104
SEx1−x2=
√104
√
1/12+ 1/12 = 4.163
stappenplan independent-samples t-toets voor σ1 = σ2:
1 hypothese H0 : µ1 = µ2 en Ha : µ1 > µ2
2 steekproevenverdeling t verdeeld met df = 12+ 12− 2 = 223 toetsingsgrootheid t = (x1 − x2)/SE = (47− 40)/4.163 = 1.6814 verwerpingsgebied α = 0.05,df = 22, t∗ = 1.7175 statistische conclusie t = 1.681 < 1.717 = t∗ en H0 wordt niet verworpen6 inhoudelijke conclusie geen verschil tussen echte en foto spinnenangst
21 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
SPSS: independent-samples t-test results
Group Statistics
group N Mean Std. Deviation
Std. Error
Mean
anxiety real
picture
12 47.00 11.029 3.184
12 40.00 9.293 2.683
Independent Samples Test
Levene's Test
for Equality of
Variances t-test for Equality of Means
F Sig. t df
Sig. (2-
tailed)
Mean
Difference
Std. Error
Difference
95% Confidence
Interval of the
Difference
Lower Upper
anxiety Equal variances
assumed
Equal variances
not assumed
.782 .386 1.681 22 .107 7.000 4.163 -1.634 15.634
1.681 21.39 .107 7.000 4.163 -1.649 15.649
(47.00-40.00)/4.163
√(11.0292/12+9.293
2/12)
“Gemiddeld genomen ervaren proefpersonen meer angst voor echte spinnen(M = 47.00, SE = 3.18) dan voor foto’s van spinnen (M = 40.00, SE = 2.68).Dit verschil was niet significant t(22) = 1.681,p = .0535.”
22 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
between- versus within-subject designs
kies voor within-subjects designs (dependent samples of paired-samples)
1 de individuele variabiliteit is verwijderd uit de standaardfout (kleinere s)dus meer power
2 er zijn minder proefpersonen nodig (maar wel wat langer)
kies voor between-subjects designs (independent samples)
1 geen order effects (geen counterbalancing nodig)
2 geen carry-over effect (geen tussentijd nodig)
23 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
afhankelijke versus onafhankelijke t-toets
vergelijking van de twee two-samples t-toetsen op dezelfde gegevens
afhankelijke steekproef (paired-samples t-toets)1 hypothese H0 : µ = 0 en Ha : µ > 02 steekproevenverdeling t verdeeld met df = n− 1 = 11
3 toetsingsgrootheid t = d/(s/√n) = 7.0/2.831 = 2.473
4 verwerpingsgebied α = 0.05,df = 11, t∗ = 2.2015 statistische conclusie t = 2.473 > 2.201 = t∗ en H0 wordt wel verworpen6 inhoudelijke conclusie wel verschil tussen echte en foto spinnenangst
onafhankelijke steekproef (independent samples t-toets)1 hypothese H0 : µ1 = µ2 en Ha : µ1 > µ2
2 steekproevenverdeling t verdeeld met df = 12+ 12− 2 = 223 toetsingsgrootheid t = (x1 − x2)/SE = 7.0/4.163 = 1.6814 verwerpingsgebied α = 0.05,df = 22, t∗ = 1.7175 statistische conclusie t = 1.681 < 1.717 = t∗ en H0 wordt niet verworpen6 inhoudelijke conclusie geen verschil tussen echte en foto spinnenangst
een dependent-samples t-toets heeft meer power door een kleinere standaardfout
24 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
samenvatting: de t-toets
1 one-sample t-toets: t = (x− µ)/(s/√n)
2 two-samples t-toets:
1 dependent samples t-toets: t = d/(s/√n), waarbij d = x1 − x2
2 independent samples t-toets:
1 unequal variances: t = (x1 − x2)/√
s21/n1 + s22/n2
2 equal variances: t = (x1 − x2)/√
s2p/n1 + s2p/n2
25 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
vorige week
een betrouwbaarheidsinterval zegt iets over de nauwkeurigheid van een schatting
we schatten het populatiegemiddelde met het steekproefgemiddelde
(natuurlijk) is deze schatting niet altijd precies goed, maar beter wanneer
de spreiding in de populatie kleiner is
de steekproef groter is
het betrouwbaarheidsniveau wordt aangegeven met C
een betrouwbaarheidsniveau van C = 0.95 geeft 95% zekerheiddat het gemiddelde van de populatie in het interval ligt
een betrouwbaarheidsniveau van C = 0.50 geeft 50% zekerheiddat het gemiddelde van de populatie in het interval ligt:dit zal een veel kleiner interval zijn
bij herhaald steekproef trekken ligt µ in 100C% van de gevallen in het intervalwe zijn bij een interval dus 100C% zeker dat µ in het interval ligt
26 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
one-sample betrouwbaarheidsinterval voor µ
betrouwbaarheidinterval indien σ bekend
betrouwbaarheidsinterval = puntschatting ± foutenmarge = x± z∗σ/√n
x is het gemiddelde van de steekproef, de schatting van µ
z∗ wordt bepaald door het betrouwbaarheidsniveau C
σ/√n is de spreiding van de steekproevenverdeling
echter, in de praktijk is σ meestal onbekendwe schatten de standaarddeviatie van de populatie σ
met de standaarddeviatie van de steekproef s
betrouwbaarheidinterval indien σ onbekend
betrouwbaarheidsinterval = puntschatting ± foutenmarge = x± t∗s/√n
er zijn nu een aantal varianten mogelijk . . .
27 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
overzicht betrouwbaarheidsintervallen
betrouwbaarheidsinterval = puntschatting ± foutenmarge
puntschattingone sample x
two samples x1 − x2
“betrouwbaarheidsniveau”one sample two samples
σ1 6= σ2 σ1 = σ2
σ bekend z∗ z∗ z∗
σ onbekend t∗(n− 1) t∗(min(n1 − 1,n2 − 1)) t∗(n1 + n2 − 2)
standaardfoutone sample two samples
σ1 6= σ2 σ1 = σ2
σ bekend σ/√n
√
σ21/n1 + σ2
2/n2
√
σ21/n1 + σ2
2/n2
σ onbekend s/√n
√
s21/n1 + s22/n2
√
s2p/n1 + s2p/n2
waarbij s2p =[
(n1 − 1)s21 + (n2 − 1)s22]
/(n1 + n2 − 2)
28 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
voorbeeld
wat is het 95% betrouwbaarheidsinterval voor µvan onze nieuwe uitgehongerde eekhoorns?
steekproefgegevens: n = 10, x = 9.45 en s = 0.6996
1 er is slechts een steekproef
2 σ is niet bekend
3 betrouwbaarheidsniveau C = 0.95 → t∗ = 2.262 (α/2 = 0.025, df = 9)
CIµ = x± t∗ × s√n
= 9.45± 2.262× 0.6996√10
= 9.45± 0.5004
het 95% betrouwbaarheidsinterval voor µ is [8.95, 9.95]
29 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
SPSS: voorbeeld
het 95% betrouwbaarheidsinterval voor µ is [8.95, 9.95]
CIµ = x± t∗ × s√n
= 9.45± 2.262× 0.6996√10
= 9.45± 0.5004
SPSS bepaalt in deze gevallen het betrouwbaarheidsinterval voor µ min testwaarde
CIµ−9.0 = (x− 9.0)± t∗ × s√n
= (9.45− 9.0)± 2.262× 0.6996√10
= 0.45± 0.5004
het 95% betrouwbaarheidsinterval voor µ− 9.0 is [−0.05, 0.95]
30 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
SPSS: one-sample CI results
CIµ−9.0 = (9.45−9.0)±2.262×0.2212 = 0.45±0.5004 → [−0.05, 0.95]
One-Sample Statistics
N Mean Std. Deviation
Std. Error
Mean
grams 10 9.450 .6996 .2212
One-Sample Test
Test Value = 9
t df Sig. (2-tailed)
Mean
Difference
95% Confidence Interval
of the Difference
Lower Upper
grams 2.034 9 .072 .4500 -.050 .950
9.45-9.0 0.45 + 2.262 x 0.2212
31 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
voorbeeld
wat is het 95% betrouwbaarheidsinterval voor µ1 − µ2
van de foto- en echte angst voor spinnen?
steekproefgegevens:n1 = 12, x1 = 47, s1 = 11.029n2 = 12, x2 = 40, s2 = 9.293
1 er zijn twee steekproeven
2 σ is niet bekend
3 s1 ≈ s2 → s2p =[
(n1 − 1)s21 + (n2 − 1)s22]
/(n1 + n2 − 2) = 103.999
4 betrouwbaarheidsniveau C = 0.95 → t∗ = 2.074 (α/2 = 0.025, df = 22)
CIµ1−µ2= (x1 − x2)± t∗ ×
√
s2p/n1 + s2p/n2
= (47− 40)± 2.074×√
103.999/12+ 103.999/12 = 7± 8.634
het 95% betrouwbaarheidsinterval voor µ1 − µ2 is [−1.634, 15.634]
32 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
SPSS: independent-samples CI results
CIµ1−µ2= (47− 40)± 2.074× 4.163 = 7± 8.634 → [−1.634, 15.634]
Group Statistics
group N Mean Std. Deviation
Std. Error
Mean
anxiety real
picture
12 47.00 11.029 3.184
12 40.00 9.293 2.683
Independent Samples Test
Levene's Test
for Equality of
Variances t-test for Equality of Means
F Sig. t df
Sig. (2-
tailed)
Mean
Difference
Std. Error
Difference
95% Confidence
Interval of the
Difference
Lower Upper
anxiety Equal variances
assumed
Equal variances
not assumed
.782 .386 1.681 22 .107 7.000 4.163 -1.634 15.634
1.681 21.39 .107 7.000 4.163 -1.649 15.649
47.00-40.00
7.000-2.074 x 4.163
nul ligt in het interval. wat betekent dat?
33 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
aannamen
we schatten de standaarddeviatie van x met de standaardfout SEx = s/√n
naarmate n groter wordt, wordt s een betere schatter van σ (ongeacht verdeling)
maar hoe groot is groot genoeg?
1 de steekproef komt uit een populatie met een normale verdeling
t is t∗-verdeeld met df = n− 1
bij gelijke n is 2 keer 5 observaties al voldoende
2 de steekproef komt uit een populatie zonder normale verdeling
n < 15: probleemn > 15: symmetrisch en geen uitbijters: t bij benadering t∗-verdeeldn > 40: t bij benadering t∗-verdeeldn groot: t bij benadering normaal verdeeld
conclusie: controleer n en de verdeling van de (verschil)scores (per groep)
34 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
deze week: wat hebben we geleerd?
de one-sample t-toets
de two-samples t-toets voor on- en afhankelijke steekproeven
het verschil tussen een t-toets voor on- en afhankelijke steekproeven
het begrip gepoolde variantie
de verschillende standaardfouten voor de independent samples t-toets
betrouwbaarheidsinterval voor one- en two-samples z- en t-toets
aannamen voor de t-toets
35 / 36
introductie one-sample t-toets dependent-samples t-toets pauze independent-samples t-toets betrouwbaarheid ten slotte
deze week: wat moeten we nog leren?
het uitvoeren en beoordelen van een one-sample t-toets
het uitvoeren en beoordelen van een two-samples t-toetsvoor zowel afhankelijke als onafhankelijke steekproeven
het uitvoeren en beoordelen van een two-samples z-toets
het bepalen en beoordelen van een one-sample betrouwbaarheidsintervalen een two-samples betrouwbaarheidsinterval voor bekende en onbekende σ
36 / 36