5.előadás (2)
description
Transcript of 5.előadás (2)
STATISZTIKA II.5.előadás
A hipotézisvizsgálat alapfogalmai
Egymintás paraméteres próbák
Statisztikai következtetések
Becslések Hipotézisek
ellenőrzése
Becslés (theta) paraméter
Pontbecslés Intervallumbecslés
θ
Hipotézis a sokaság(ok) eloszlására, vagy az adott eloszlás(ok) egy vagy több paraméterére vonatkozó feltevés(ek)
Nullhipotézis (H0) Alternatív hipotézis (H1)
Statisztikai próba alapján a nullhipotézist teszteljük, a neki ellentmondóalternatív hipotézissel szemben.
Döntést mindig a nullhipotézisről hozunk.
Közvetve hozunk róla döntést
Hipotézisvizsgálat
A sokaságra vonatkozó különféle feltevések (hipotézisek) helyességének mintavételi eredményekre alapozott vizsgálata.�Eszközei: statisztikai próbák, tesztek�Feltételek:
a vizsgált sokaság eloszlásaa mintavétel módjaa minta nagysága
Példa: 500 grammos kávé töltősúlyát kívánjuk ellenőrizni
Egyoldali próbák
(baloldali illetve jobboldali próba)
Kétoldali próba
gH 500 :0
=µ
gH 500 :1
≠µ
gH 500 :0
≥µ
gHb 500 :
1<µ
gH 500 :0
≤µ
gHj 500 :
1>µ
Hipotézisek megfogalmazása(Pl. várható értékre)
Egyoldali próbák:� csak az egyik irányban állít korlátot (csak ilyen irányú eltérés lehetséges vagy fontos számunkra)
Kétoldali próba:
� két oldalról állít alsó és felsőkorlátot (a feltételtől való eltérés tényét vizsgáljuk, irányát nem)
00 : µµ = H
0 H µµ ≠:1
00 : µµ ≥H
01 : µµ <bH
00 : µµ ≤H
01 : µµ >jH
baloldali jobboldali
Nullhipotézis (H0)
� Egyszerű hipotézis:
� Összetett hipotézisek:
Technikai nullhipotézis:
00 : µµ ≥H
00 : µµ =H
00 : µµ ≤H
00 : µµ =TH
Az egyoldali alternatív hipotézisnek legkevésbé
ellentmondó egyszerű hipotézis.0H
Példa: kávé töltősúly
� Sokasági szórás 15 g� n=100 elemű FAE minta,� Hipotézisek:
� Ha helyes a H0
y ~
)5,110015,500( ggN =y ~
),( nN σµ
gH 500 :0
=µ
gH 500 :1
≠µ
gy 497=
A mintaátlagok eloszlása
500==Yµ 5,196,150094,502 ⋅+=06,4975,196,1500 =⋅−
y << 502,94 g497,06 g
%951 =− α
%5,22/ =α%5,22/ =α
Döntés: H0 hipotézis nem hihető
94,50206,497
%5,22/ =α%5,22/ =α
K KElfogadási tartomány
500=Y
gy 497=
A hipotézisvizsgálat lépései
1) A hipotézis megfogalmazása2) Próbafüggvény választás3) Szignifikanciaszint és kritikus tartomány4) Mintavétel és döntés
A próbafüggvény
• A próbafüggvény a véletlen minta elemeinek függvénye, értéke
mintáról-mintára változik.
• A próbafüggvény – a mintavétel előtt - valószínűségi változó, a
mintavétel után pedig az adott valószínűségi változónak egy
konkrét értéke, realizációja.
• Valószínűségi eloszlása bizonyos feltételek (a vizsgált
sokaság eloszlása, a mintavétel módja, a minta nagysága) és a
nullhipotézis helyességének a feltételezése mellett ismert.
Adott megbízhatósággal (valószínűséggel) megszerkeszthető,
hova várjuk a próbafüggvény értékét.
( )n
yyyT , ... , ,21
Próbafüggvény (példa)
25,1
3
10015
5004970 −=
−=
−=
−=
n
yz
σ
µ
Tetszőleges eloszlásból származó nagy minta, ismert sokasági szórás
Szignifikancia-szint és kritikus tartomány
A hipotézis helyességének ellenőrzése céljából a próbafüggvény lehetséges értékeinek teljes tartományát alkalmas osztópontok segítségével két egymást át nem fedőrészre bonjuk:
�Elfogadási tartomány (E)
�Visszautasítási – kritikus – tartomány (K)
: szignifikancia-szint
( )( ) α−=∈ 1 , ... , ,21
EyyyTPn
( )( ) α=∈KyyyTPn
, ... , ,21
α
Az E és a K tartomány lehetségeselhelyezkedésének esetei
zz <2αH0 hipotézist elfogadjuk, ha
1.
21 α−< z
o
oo
H
H
µµ
µµ
≠
=
:
:
1
ac fc
Szignifikancia-szint, elfogadási és kritikus tartomány (példa)
96,1−=a
c 96,1+=f
c
%951 =−α
975,0025,02
zzz −==α 975,012
zz =− α
%5=α
fc
2.
3.
H0 hipotézist elfogadjuk, ha
H0 hipotézist elfogadjuk, ha zz <α
α−< 1zz
00 : µµ = HT
01 : µµ >jH
00 : µµ = HT
01 : µµ <bH
ac
Az E és a K tartomány lehetségeselhelyezkedésének esetei
Mintavétel és döntés� A mintavétel végrehajtása, majd a próbafüggvény
számszerű értékének meghatározása a mintából.� Döntés:
� Ha a próbafüggvény értéke az E tarto-mányba esik, a tapasztalati adatok ααααszignifikancia szinten nem mondanak ellent a nullhipotézisnek. ( -t elfogadjuk)
� Ha a próbafüggvény értéke a K tarto-mányba esik, a nullhipotézist elvetjük és az alternatív hipotézist fogadjuk el.
0H
Döntés (példa)
A kivett 100 elemű minta alapján a próbafüggvény konkrét értéke -2.Mivel ez az érték kisebb, mint -1,96, azaz a próbafüggvény értéke a visszautasítási (K) tartományba esik, ezért 5%-os szignifikancia-szinten
H0-t elvetjük
H1-t elfogadjuk
p-érték (empirikus szignifikancia-szint)
0α≤p
0α>p
Az a legkisebb valószínűség, amely mellett a vizsgált H0hipotézist elutasíthatjuk a H1 hipotézissel szemben, azaz, ahol éppen az elfogadásból az elutasításba váltunk.
Döntés a p értéke alapján:
H0-t elvetjük
H0-t elfogadjuk
Példában:
Próbafüggvény értéke:
(kétoldali)
2−=z
gH 500 :1
≠µ
0456,0)9772,01(2
9772,02/1222/12/
=−=
=−=−=−
p
pzzpp
H0-t elvetjük
H0-t elfogadjuk
0%56,4 α≤
0%56,4 α>
%5=α
K Elfogadási tartomány
gy 497=
525,4975,165,1500 =⋅−
500 : 1
<µbH
H0 hipotézist elfogadjuk, ha zzz <−= −αα 1
500 : 0
=µTH
500 : 1
<µbH
ac
Példa: egyoldali (baloldali) tesztelés
%951 =− α2
5,1
3
10015
5004970 −=
−=
−=
−=
n
yz
σ
µ
Döntés: a technikai nullhipotézist elutasítjuk
%5=α
65,195,005,0
−=−== zzzα
500 : 0
≥µH
p-érték (egyoldali tesztelés):
� Próbafüggvény értéke 2−=z
150 : 1 <µbH (egyoldali)
0228,09772,01
9772,01221
=−=
=−=−=−
p
pzzpp
0%28,2 α≤
0%28,2 α>
H0-t elvetjük
H0-t elfogadjuk
A -ról való döntés során elkövethető hibák
�Elsőfajú hiba:
elvetjük -t, pedig az a valóságban igaz ( -t tévesen vetjük el)
�Másodfajú hiba:
nem vetjük el (elfogadjuk) -t, pedig az a valóságban nem igaz. ( -t tévesen nem vetjük el/elfogadjuk)
0H
0H
0H
0H
0H
Döntési tábla
a valóságban
hipotézist
elfogadjuk elvetjük
igazHelyes döntés Elsőfajú hiba
hamisMásodfajú hiba Helyes döntés
0H 0
H
)1( α−
)1( β−)(β
)(α
A másodfajú hiba
H0 H1 H2
β1
β2
Rossz nullhipotézis alapjánszerkesztett próbafüggvény
Igazságnak megfelelő eloszlás
Mitől függ a másodfajú hiba elkövetésének esélye?
� Mekkora az értéke� Milyen messze van az igaz
nullhipotézis� Mekkora a mintaelemszám (első és
másodfajú hiba valószínűségeegyszerre csak a mintaelemszámnövelésével csökkenthető)
α
PRÓBÁK� Egymintás paraméteres próbák:
- Várható értékre- Sokasági arányra (nagymintás)- Varianciára
� Nagymintás nemparaméteres próbák:
- Illeszkedésvizsgálat- Függetlenségvizsgálat- Két eloszlás egyezőségének vizsgálata
� Két független mintás paraméteres próbák
-Várható értékre-Sokasági arányra-Varianciákra
� Több független mintás paraméteres próbák
-Több sokaság várható értékének összehasonlítása
Várható értékre vonatkozóegymintás paraméteres próbák
1. Z-próba
Alkalmazási feltételei:- normális eloszlás- ismert szórás
Próbafüggvény:
Minta nagyságára való tekintet nélküleloszlást követ.
)1,0(N
n
yz
σ
µ 0−=
00 : µµ = H
Várható értékre vonatkozóegymintás paraméteres próbák
2. t-próbaAlkalmazási feltételei:
- normális eloszlás- a sokasági szórás nem ismert
Próbafüggvény:
A próbafüggvény szabadságfokút-eloszlást követ.
1−n
n
s
yt 0µ−
=
00 : µµ = H
Várható értékre vonatkozóegymintás paraméteres próbák
3. Aszimptotikus Z-próba
Alkalmazási feltételei:- véges szórású tetszőleges eloszlásból
származó nagy minta
Próbafüggvény:
A próbafüggvény aszimptotikusan standardnormális eloszlású.
n
s
yz
0µµµµ−=
00 : µµ = H
Sokasági arányra irányulónagymintás próba
Alkalmazási feltétel: - n elemű FAE minta
Próbafüggvény:
00 : PPHT =
n
PP
Ppz
)1( 00
0
−
−=
A próbafüggvény aszimptotikusan standard normális eloszlású.
Példa: selejtes termékek aránya
� n = 500 elemű FAE minta,� k = 20 (selejtes termékek száma)� Állítható-e 5%-os szignifikancia-szinte, hogy a
selejtes termékek aránya a sokaságban 5% alatt van?
� Hipotézisek:
05,0 :0
≥PH
05,0 :0
=PHT
05,0 : 1
<PHb
%5=α
K Elfogadási tartomány
%4=p
%39,3975,065,15 =⋅−
05,0 : 1
<PHb
H0 hipotézist elfogadjuk, ha z<− 65,1
05,0 : 0
=PHT
05,0 : 1
<PHb
ac
Példa: egyoldali (baloldali) tesztelés
Döntés: a technikai nullhipotézist elfogadjuk, az alternatív hipotézist elvetjük 5%-os szignifikancia-szinten
05,0 : 0
≥PH
03,100975,0
01,0
500
95,005,0
05,004,0
)1(00
0 −=−
=⋅
−=
−
−=
n
PP
Ppz
p-érték (egyoldali tesztelés):
� Próbafüggvény értéke z = -1,03
05,0 : 1
<PH b(egyoldali)
1515,08485,01
8485,0103,103,11
=−=
=−=−=−
p
pzzpp
0%15,15 α≤
0%15,15 α>
H0-t elvetjük
H0-t elfogadjuk
Szórásnégyzetre irányulópróbák
Alkalmazási feltétel: normális eloszlás
Próbafüggvény:
n-1 szabadságfokú -eloszlásKritikus értékek:
2χ
20
22 )1(
σχ
sn −=
)()(:
)(:
)(:
22/1
22/
20
21
220
21
21
20
21
νχνχσσ
νχσσ
νχσσ
αα
α
α
−
−
==≠
=<
=>
fa
ab
fj
césc H
c H
c H
: 2
0
2
0 σσ =TH