Nemparaméteres próbák 1
A binomiális eloszláson alapuló próbák
• Binomiális próba: Hipotézisvizsgálat az előfordulások arányára, egy minta esetén
• Két arány összehasonlítása
Nemparaméteres próbák 2
9. példaAz újszülöttek között a tapasztalatok szerint a fiúk aránya 50/100. Egy kórházban egy napon 8 fiú és 4 lány születik. Jelent-e ez bármi szokatlant?
Előfordulhat ilyen? Milyen valószínűséggel?
5.0:H 00 01 :H
Binomiális próba Hipotézisvizsgálat az előfordulások arányára, egy minta esetén
5.0:H 00 5.0:H 01
Nemparaméteres próbák 3
Kismintás (egzakt) eljárás
A próbastatisztika a mintában a lányok k0 száma.
knk
kn
kP
)1(
5.04kP
Annak vsz-e, hogy 4 vagy kevesebb lány legyen 12 közül, 0.194Döntés?
Nemparaméteres próbák 4
Mekkora annak vsz-e, hogy 1 vagy kevesebb lány legyen 12 közül, ha p=0.5? (H0: p=0.5)
Elhiggyük?
a nullhipotézis igazsága esetén annak valószínűsége, hogy a talált vagy még szélsőségesebb adódjék p
Ha p0.05, elutasítjuk a nullhipotézist.
Pontosabban, ha p, elutasítjuk a nullhipotézist. a szignifikanciaszintHogy döntünk, ha = 0.05, 0.01, 0.001?
Nemparaméteres próbák 5
Nagymintás eljárás 111
nnp
n
)1(0
0
nnku nem ismert
Wald: ˆ
0
)ˆ1(ˆ0
0
nnku
score)1( 00
00
nnku
nk
Nemparaméteres próbák 6
Wald: ˆ
5.00 score
333.0124ˆ
nk
225.1667.0333.012
5.0124)ˆ1(ˆ
000
nnku
155.1)5.01(5.012
5.0124)1( 00
000
nnku
11.089.01 p
124.0876.01 p
Nemparaméteres próbák 7
Wald: ˆ
score
919.0667.0333.012
5.0125.04)ˆ1(ˆ
5.0 000
nnku
A folytonossági (Yates-) korrekcióval
4 vagy kevesebb → 4.5 vagy kevesebb : +0.5
-1.155 ill. p0.124 helyett
867.0)5.01(5.012
5.0125.04)1(
5.0
00
000
nnku
-1.225 ill. p=0.11 helyett
konzervatív (a nullhipotézist megtartó) irányban változott
18.082.01 p
193.0807.01 p
Nemparaméteres próbák 8
Döntés?
333.012040124
10. példa
Az illető kórházban egy napon 80 fiú és 40 lány születik. Jelent-e ez bármi szokatlant?
Nemparaméteres próbák 9
11. példa
Mekkora minta szükséges ahhoz, hogy 90% biztonsággal észrevegyük, ha 0.5 helyett 0.4 (0.45, 0.49) a lányok születésének valószínűsége?
90% (0.9) a próba ereje (Power)p=0.5 a nullhipotézisp=0.4 (0.45, 0.49) az ellenhipotézis (alternative)
Sample Size Calculation One Proportion, Z, Chi-Square TestH0: Pi >= Pi0Value
Null Proportion (Pi0)Population Proportion (Pi)Alpha (Nominal)Actual Alpha (Exact)Power GoalActual Power (Normal Approx.)Actual Power (Exact)Required Sample Size (N)
0.50000.40000.05000.05440.90000.89450.9017
206.0000
Nemparaméteres próbák 10
One Proportion: Sample Size CalculationTest on One Proportion (H0: Pi >= Pi0)
N vs. Pi (Alpha = 0.05, Pi0 = 0.5, Power = 0.9)
0.38 0.40 0.42 0.44 0.46
Population Proportion (Pi)
100
200
300
400
500
600
700
800
900
Sam
ple
Siz
e (E
xact
)
One Proportion: Sample Size CalculationTest on One Proportion (H0: Pi >= Pi0)
N vs. Pi (Alpha = 0.05, Pi0 = 0.5, Power = 0.9)
0.38 0.40 0.42 0.44 0.46 0.48 0.50 0.52
Population Proportion (Pi)
-2500
2500
7500
12500
17500
22500
Sam
ple
Siz
e (E
xact
)
Nemparaméteres próbák 11
A binomiális eloszláson alapuló kétmintás próbák12. példa(M.J. Campbell, D. Manchin, Medical Statistics. A commonsense approach,
2nd edition, J. Wiley & Sons, 1993, p. 71)
A páciensek kétféle gyógyszert kaptak, kisorsolva, hogy ki melyiket. Kettős vak vizsgálatot végeztek: az orvos és a páciens sem tudja, hogy ki melyik gyógyszert kapja.
Van-e a két gyógyszer között különbség a tekintetben, hogy egyforma arányban gyógyultak-e tőlük a betegek? Gyógyszer típusa Gyógyult Nem gyógyult A 23 7 30 B 18 13 31 41 20 61
Nemparaméteres próbák 12
1 annak valószínűsége, hogy a beteg az A gyógyszertől meggyógyul2 annak valószínűsége, hogy a beteg a B gyógyszertől meggyógyul
210 :H 211 :H
Az A és B gyógyszernél a gyógyulás relatív gyakorisága külön-külön binomiális eloszlást követ 1 és 1 paraméterrel
Nemparaméteres próbák 13
7667.03023ˆ1 5806.0
3118ˆ2
)ˆ()ˆ(
ˆˆ)ˆˆ(
ˆˆ
21
2121
21
2121
VarVarVaru
Elég nagy minták esetén
Gyógyszer típusa Gyógyult Nem gyógyult A 23 7 30 B 18 13 31 41 20 61
Nagymintás eljárás
Nemparaméteres próbák 14
)ˆ()ˆ(ˆˆ
21
210
VarVar
u
n
Var )1()ˆ(
2
22
1
1121
)1()1()ˆ()ˆ(nn
VarVar
2
22
1
11
210 )1()1(
ˆˆ
nn
u
2
22
1
11
2121
0 )1()1(
1121ˆˆ
nn
nnu
A folytonossági korrekcióval
Nemparaméteres próbák 15
1 és 2 nem ismert
2
22
1
11
210 )1()1(
ˆˆ
nn
u
Wald 11 2 2ˆ
2
22
1
11
210 )ˆ1(ˆ)ˆ1(ˆ
ˆˆ
nn
u
583.1
31)5806.01(5806.0
30)7667.01(7667.0
5806.07667.0
057.0.94331583.11 F 114.0057.02 p
Nemparaméteres próbák 16
1 és 2 nem ismert
2
22
1
11
210 )1()1(
ˆˆ
nn
u
score 672.061
1823ˆˆˆ
21
221`1
nnnn
547.1
311
301)672.01(672.0
3118
3023
11)ˆ1(ˆ
ˆˆ
21
210
nn
u
061.0939.01547.11 F 122.0061.02 p
Nemparaméteres próbák 17
Wald
Gyógyszer típusa Gyógyult Nem gyógyult A 23 7 30 B 18 13 31 41 20 61
2
22
1
11
2121
0 )ˆ1(ˆ)ˆ1(ˆ
1121ˆˆ
nn
nnu
folytonossági korrekcióval
304.1
31)5806.01(5806.0
30)7667.01(7667.0
311
301
215806.07667.0
0
u
konzervatívabb 1.583 ill. p=0.114 helyett
p=0.904
Nemparaméteres próbák 18
Módosított kérdés: Az A (új) gyógyszer jobb-e a B (elfogadott jelenlegi) gyógyszernél?
210 :H 211 :H
061.0939.01547.11 Fp
547.1
311
301)672.01(672.0
3118
3023
11)ˆ1(ˆ
ˆˆ
21
210
nn
u
Nemparaméteres próbák 19
Gyógyszertípusa
Gyógyult Nemgyógyult
A 23 7 30B 18 13 31 41 20 61
Statistics>Nonparametrics
Nemparaméteres próbák 20
2 x 2 Table (creditscoring)Column 1Column 2 Row
TotalsFrequencies, row 1Percent of totalFrequencies, row 2Percent of totalColumn totalsPercent of totalChi-square (df=1)V-square (df=1)Yates corrected Chi-squarePhi-squareFisher exact p, one-tailedtwo-tailedMcNemar Chi-square (A/D)Chi-square (B/C)
23 7 3037.705% 11.475%49.180%
18 13 3129.508% 21.311%50.820%
41 20 6167.213% 32.787%
2.39 p= .12182.35 p= .12491.62 p= .2025
.03925p= .1009p= .1737
2.25 p= .13364.00 p= .0455
dbcadcba
bcadN
220
dbcadcba
NbcadN
2
20
2
(folytonossági korrekcióval)
Gyógyszertípusa
Gyógyult Nemgyógyult
A 23 7 30B 18 13 31 41 20 61
Nemparaméteres próbák 21
A szükséges minta-elemszám meghatározása
210 :H
nn
u2211
210 11
ˆˆ
uu 0elfogadjuk, ha
00 HuuPAz elsőfajú hiba valószínűsége:
211 :H
Nemparaméteres próbák 22
A szükséges minta-elemszám meghatározása
nn
u2211
210 11
ˆˆ
uu 0elfogadjuk, ha
210 :H
13. példaMekkora mintákra van szükség, ha 80% biztonsággal észre akarjuk venni, hogy az egyik gyógyszerrel a betegek 20%-a, a másikkal 30%-a gyógyul meg?
Az elsőfajú hiba valószínűsége: 00 HuuP
211 :H
Nemparaméteres próbák 23
nn
u2211
210 11
ˆˆ
nnnn2211
21
2211
2121
1111ˆˆ
uu 0elfogadjuk, ha
1
2221
21 H11
u
nn
uP
10 H uuP
Nemparaméteres próbák 24
uuP
nn
uuP
2222
H21
111
nn
uu H
1122
21
111
1
1
H22112H21
2
11
uun
Nemparaméteres próbák 25
Példa ?21 nnn
=0.05, =0.2, A=0.2, B=0.3
645.1u 84.0u
4.2283.013.02.012.03.02.084.0645.1
2
2
n
1
1
H22112H21
2
11
uun
Nemparaméteres próbák 26
Nemparaméteres próbák 27
Comparing 2 Proportions: Sample Size CalculationTwo Proportions, Z-Test (H0: Pi1 <= Pi2)
N vs. Power (Pi1 = 0.3, Pi2 = 0.2, Alpha = 0.05)
0.70 0.75 0.80 0.85 0.90 0.95 1.00
Power Goal (No Continuity Correction)
150
200
250
300
350
400
450S
ampl
e S
ize
for E
ach
Gro
up (N
1 =
N2)
Nemparaméteres próbák 28
A Statistica Power Analysis eredményei:
A B n (korr. nélkül) n (korrekcióval)0.2 0.3 231 2510.3 0.4 281 3000.3 0.5 71 830.1 0.3 49 580.4 0.6 77 860.4 0.3 281 300
Nagyobb javulás (vagy romlás) kimutatásához kevesebb kísérlet is elég.A placebóval való kísérletezést egyre többször tiltják.
Nemparaméteres próbák 29
Kismintás (egzakt) eljárás
Gyógyszer típusa Gyógyult Nem gyógyult A 1 9 10 B 3 1 4 4 10 14 Gyógyszer típusa Gyógyult Nem gyógyult A a b r1 B c d r2 c1 c2 N
210 :H 211 :H
(az előző példához képest fordított)
14. példa
Nemparaméteres próbák 30
210 :H 211 :H
Annak valószínűsége, hogy r1 közül (akik az A gyógyszert szedik) a gyógyuljon meg
ara
ar
axP
1
111
1 1
Annak valószínűsége, hogy r2 közül (akik a B gyógyszert szedik) c gyógyuljon meg:
crc
cr
cxP
2
222
2 1 független események
a b r1
c d r2c1 c2 N
Nemparaméteres próbák 31
021 H; bxaxP
carrcacrcara
cr
ar
cr
ar
2121 111 2121
p annak valószínűsége, hogy a kapott vagy annál is szélsőségesebb eredmény adódjék, ha a nullhipotézis igaz
1 9 0 10 1 9 0 10 3 1 3 1 4 0 4 0
212121
1
2
2
1H,0 2
2
1
1021
xxrrxxa
x
r
cx xr
xr
cxaxPp
a b r1
c d r2
c1 c2 N
Nemparaméteres próbák 32
Hogy a képlettel számolni tudjunk, számértékére is szükség van
, ami mellett p maximális: =0.3
(0,10,4,0)(1,9,4,0)(0,10,3,1)(1,9,3,1) PPPPp
0.012495150.00915220.00213550.00098060.0002288
a b r1
c d r2c1 c2 N
212121
1
2
2
1H,0 2
2
1
1021
xxrrxxa
x
r
cx xr
xr
cxaxPp
Nemparaméteres próbák 33
A nagymintás (közelítő) eljárással:
2857.014
31ˆ
N
ca
a b c d
1 9 3 1
43.2
41
1012857.012857.0
43
101
11ˆ1ˆ
ˆˆ
21
210
nn
u
p=0.0075folytonossági korrekcióval p=0.038
0.0125p
Nemparaméteres próbák 34
A hatás nagyságának értelmezése
2
1
RR kockázati arány (Risk Ratio )
2
1
ˆˆ
RR1
1ˆrb
2
2ˆrc
1
2
crbrRR
a b r1
c d r2c1 c2 N
Nemparaméteres próbák 35
21
21 ˆlnˆlnlncrd
arbVarVarRRVar
212
1
2
212
1
2 expexpcrd
arbu
crbr
RRcrd
arbu
crbr
Konfidencia-intervallum a kockázati arányraa b r1
c d r2
c1 c2 N
212
1
2
212
1
2 lnlnlncrd
arbu
crar
RRcrd
arbu
crar
41.124.1 RRA 13. példára
Nemparaméteres próbák 36
15. példa(B. Rosner: Fundamentals of Biostatistics, Duxbury Press, 5th ed. 2000, p. 358)
A 40 és 44 év közötti életkorú nőknél a fogamzásgátló tabletta szedése növeli-e a szívinfarktus kockázatát?
kapott-e infarktust? szedett-e tablettát? igen nem igen 13 4987 5000 nem 7 9993 10000 20 14980 15000
Nemparaméteres próbák 37
1 annak valószínűsége, hogy aki szedett fogamzásgátló tablettát (exposed), infarktust kapjon 2 …aki nem szedett (unexposed) …
0026.0500013ˆ1 0007.0
100007ˆ2
71.30007.00026.0
100007
500013
ˆˆ
2
1 RR
kapott-e infarktust? szedett-e tablettát? igen nem igen 13 4987 5000 nem 7 9993 10000 20 14980 15000
Nemparaméteres próbák 38
1000079993
500013498796.1
50007100004987lnln
212
1
2
crd
arbu
crbr
394.04685.096.1312.1
230.24685.096.1312.1
A kockázati arány logaritmusára a 95%-os konfidencia-intervallum alsó határa:
fölső határa:
A 95%-os konfidencia-intervallum magára a kockázati arányra:
3.9,5.1, 230.2394.0 ee (retrospektív!)
Nemparaméteres próbák 39
Esélyhányados
1
odds
Esélyhányados-arány (odds ratio)
2
2
1
1
1
1
OR
a megbetegedés esélyhányados-aránya (disease odds ratio)
bcad
dcddccbabbaa
OR
a b r1
c d r2
c1 c2 N
Nemparaméteres próbák 40
1
2
11
RROR
1,1 21 ha RROR
Nemparaméteres próbák 41
A vizsgálatok esetei
Prospektív (prospective)
clinical trial (kisorsolják, hogy ki melyik gyógyszert kapja)cohort study*
Retrospektív (retrospective)case-control*matched pair (?)cross-sectional*
*observational (/experimental)
Nemparaméteres próbák 42
16. példa(A. Agresti: Categorical data analysis, J. Wiley, 2002, p. 41)
709 tüdőrákkal diagnosztizált páciens mellé választottak 709 olyan pácienst, akit ugyanabban a kórházban kezeltek, ügyelve arra, hogy nem- és kor-eloszlásuk hasonló legyen.
dohányos tüdőrákban szenvedigen (T) nem (T)
igen (D) 688 650nem (D) 21 59 709 709
DTP
DTP
DTPRR
Nemparaméteres próbák 43
A dohányzás szerinti két csoportba nem válogathatták véletlenül a pácienseket, mint a szokásos gyógyszer-kísérleteknél,
nem a dohányzás (igen/nem) a rögzített, és a tüdőrák előfordulása a valószínűségi változó, hanem fordítva
ezért csak az esély-hányados-arányt számíthatjuk ki:
TDP
TDPOR
a veszélyeztetettség esélyhányados-aránya (exposure odds ratio)
Nemparaméteres próbák 44
DTP
DTPOR
a megbetegedés esélyhányados-aránya (disease odds ratio), ez lenne érdekes, de…
TDP
TDPOR
a veszélyeztetettség esélyhányados-aránya (exposure odds ratio)
Nemparaméteres próbák 45
97.22165059688
bcad
dbd
dbb
cac
caa
OR
a b r1
c d r2
c1 c2 N
dohányos tüdőrákban szenvedigen (T) nem (T)
igen (D) 688 650nem (D) 21 59 709 709
dcba
ORVar 1111ln
0676.0591
211
6501
6881ln ORVar
599.1,579.00676.096.1089.1:ln OR OR: (1.745, 4.948)
Nemparaméteres próbák 46
97.22165059688
bcad
dbd
dbb
cac
caa
OR
A veszélyeztetettség becsült esélyhányados-arányának kifejezése pon-tosan ugyanaz, mint a megbetegedés becsült esélyhányados-arányáé!
97.22165059688
bcad
dcd
dcc
bab
baa
OR
Nemparaméteres próbák 47
TPTDPTPTDP
TPTDPDTP
P(T) prevalencia ismerete szükséges
Bayes-tétel:
1
2
11
RROR ha 1< <1, 2< <1 ORRR
Top Related