Vzorčenje in statistično zaključevanjepsy.ff.uni-lj.si/Katedre/PM/gradiva/RMP2-1-Pregled...
Transcript of Vzorčenje in statistično zaključevanjepsy.ff.uni-lj.si/Katedre/PM/gradiva/RMP2-1-Pregled...
22.11.2011
1
Vzorčenje in statistično zaključevanje
Doktorski študij Humanistika in družboslovje, psihološke smeri
Raziskovalna metodologija v psihologiji
Izr. prof. dr. Anja Podlesek
2
Populacija in vzorec
• posploševanje z vzorca na populacijo
• opredelitev populacije in vzorca sestavljanje liste, s katere vzorčimo
• reprezentativnost, nepristranskost vzorec ima podobne lastnosti kot populacija (enakost deležev)
• velikost vzorca ekonomičen N, dopustna napaka vzorčenja, variabilnost pojava, pričakovana razlika, določitev N iz enačb za testiranje hipotez
3
Verjetnostno vzorčenje
• Naključno vzorčenje (lista elementov; vrečka, tabele naključnih števil, PC (Excel); reprezentativnost ni garantirana!)
• Stratificirano vzorčenje (razdelitev populacije na razrede, iz njih naključno / proporcionalno vzorčimo)
• Sistematično vzorčenje (naključno določen začetek, korak k elementov)
• Vzorčenje klastrov (naključen izbor klastra oziroma vzorčne enote, vzorec = vsi člani klastra)
• Večstopenjsko vzorčenje (določimo večje klastre, naključno izberemo nekaj klastrov, naključno vzorčimo iz posameznega klastra)
naključen izbor
vsak element ima enako možnost izbora v vzorec
visoka zunanja veljavnost
4
Druge tehnike vzorčenja
• Priložnostno vzorčenje (problem prostovoljnih udeležencev)
• Namensko vzorčenje (udeleženci imajo določene lastnosti): – vzorčenje pogostih primerov
– vzorčenje ekstremnih primerov oz. raznolikosti
– vzorčenje ekspertov
– kvotni vzorec
– vzorčenje po principu “snežne kepe”
5
Teorija vzorčenja
Spremenljivka
Statistika
Parameter
Napaka vzorčenja
Teorija vzorčenja
• Govori o odnosih med populacijo in vzorci, ki jih vlečemo iz nje.
• Če poznamo populacijo, lahko določimo verjetnost, da bomo iz nje potegnili specifičen vzorec (s specifično statistiko).
• Obratno delamo pri statističnem zaključevanju: izmerimo vzorec, sklepamo o populaciji.
populacija vzorec
verjetnost
statistično zaključevanje/ posploševanje/sklepanje ali inferenčna statistika (angl. statistical inference)
6
22.11.2011
2
7
Vzorčne porazdelitve
statistika statistika statistika
Vzorčna porazdelitev
… je porazdelitev statistike neskončnega števila vzorcev
Vzorci se razlikujejo.
8
Vzorčne porazdelitve
• Če iz definirane populacije izberemo vse možne vzorce velikosti N, lahko za vsak vzorec določimo statistike (npr. M, SD). Statistike se od vzorca do vzorca spreminjajo. vzorčne porazdelitve statistik
– opisnih statistik vzorca, npr. M, var, p, r…
– drugih izrazov, npr.
• Vsako vzorčno porazdelitev lahko opišemo: Mstatistike SD = SEstatistike
21
21
MMSE
MM
9
Vzorčne porazdelitve
Mstatistike
SEstatistike
M
SD
frekvenčna porazdelitev spremenljivke
vzorčna porazdelitev statistike za manjše / večje vzorce
Če je vzorec velik, bo statistika vzorca bolj podobna parametru. Razpršenost vzorčne porazdelitve se z večanjem vzorca manjša.
10
NSE
σσ MM
SEM = standardni odklon vzorčnih
aritmetičnih sredin
= standardna napaka ocene m
NSE
2
σσ
N
ppSE
)1(p
Standardna napaka
Standardna napaka se z večanjem vzorca manjša.
Verjetnost pojavljanja vzorčne statistike pri velikih vzorcih
• Če poznamo parameter v populaciji, lahko:
– določimo verjetnost pojavljanja določene vrednosti vzorčne statistike.
𝑧 =𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑘𝑎−𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑒𝑟
𝑆𝐸statistike p
– določimo interval vrednosti statistike, ki jo pričakujemo v srednjih k % vzorcev.
11 12
Gpop
SEG
vzorčna porazdelitev G je N.D.
Gvz
0
1
N (0,1)
G
popvz
pSE
GGz
z
Verjetnost pojavljanja vzorčne statistike pri velikih vzorcih
22.11.2011
3
Vzorčna porazdelitev aritmetične sredine
NSE
σσ MM SEM v primeru neskončnih populacij
ali vzorčenja z vračanjem
1
σσ MM
p
p
N
NN
NSE
SEM v primeru končnih populacij Np … velikost populacije N … velikost vzorca Enačba velja, ko je Np > N.
Korekcija za končnost populacije
𝜇M
σM=SEM = SEM
E(M) = m
μM = μ
Iz zakona velikih števil sledi, da je, če iz
populacije naključno izberemo vzorec
velikosti N, pričakovana vrednost aritmetične
sredine vzorca (M) enaka populacijski
sredini (μ).
13
Vzorčna porazdelitev aritmetične sredine
• Je pri velikih vzorcih asimptotično normalna, ne glede na to, kakšna je porazdelitev spremenljivke v populaciji (centralni limitni izrek).
• Tudi pri majhnih vzorcih je normalna, če se spremenljivka v populaciji porazdeljuje normalno. Če se ne, vzorčna porazdelitev sredin majhnih vzorcev ni normalna. preveriti normalnost porazdelitve spremenljivke v populaciji!
• Pri velikih vzorcih je s‘ zelo verjetno zelo blizu pravi vrednosti s, in zato je tudi SEstatistike zelo blizu pravi SD cenilk.
• Pri majhnih vzorcih, če ne poznamo variance spremenljivke v populaciji (oz. s), je izračun SE statistike bolj negotov – SE‘M, izračunana po predstavljenih enačbah za velike vzorce, je pristranska ocena populacijske standardne napake (jo podcenjuje).
14
• Studentova t porazdelitev: pri ocenjevanju aritmetične sredine spremenljivke, ki se v populaciji normalno porazdeljuje, ko imamo opravka z majhnimi vzorci in ne poznamo s
df = ∞ z df = 30
15
Vzorčne porazdelitve pri majhnih vzorcih
Prostostne stopnje
• angl. degrees of freedom df
• df = število vrednosti pri končnem izračunu statistike, ki lahko prosto variirajo (= št. neodvisnih podatkov – št. predhodno ocenjenih parametrov)
X = 1, 2, 3
• 𝑀 = 𝑋
𝑁= 2 vključeni trije neodvisni kosi informacije
• 𝑣𝑎𝑟 = 𝑋−μ 2
𝑁= 2/3 vključena dva neodvisna kosa
informacije (N-1) pred tem smo ocenili μ
16
Vzorčne porazdelitve pri majhnih vzorcih
Če iz normalno porazdeljene populacije s standardno deviacijo s potegnemo N podatkov in izračunamo zgornjo statistiko (odklone računamo od vzorčne M), se ta porazdeljuje po c2 porazdelitvi z df=N-1.
2
2
2
22
2
22
2
2
1
2
2
1
2
2
1 i
ii2
σ
σ')1(
σχ
σ
)(...)()(
σχ
σ
μχ
NSDN
MXMXMXSS
zX
N
N
i
i
N
i
17
df = N
df = N – 1
df = N – 1
Z večanjem df se c2 porazdelitev približuje normalni.
Vzorčne porazdelitve pri majhnih vzorcih
Če se vzorec 1 veča proti neskončnemu, se F-porazdelitev približuje hi-kvadrat porazdelitvi z df=N2-1. Z večanjem obeh vzorcev proti neskončnemu N se F-porazdelitev približuje normalni.
18
1χ
1χ
σ1
σ1
1ˆ
σˆ
σˆ
2
2
2
1
2
1
2
22
2
22
2
11
2
11
j
2
jj2
j
2
2
2
2
2
1
2
1
N
N
NSDN
NSDNF
N
SDNs
s
sF
F porazdelitev se pojavi pri primerjavi varianc dveh vzorcev.
Oblika F porazdelitve je odvisna od dveh df, in sicer od df, vezane na števec, in df, vezane na imenovalec zgornje enačbe: df1= N1-1, df2 = N2-1.
Vzorčne porazdelitve pri majhnih vzorcih
22.11.2011
4
19
Statistično zaključevanje
Izberemo vzorec.
Določimo statistiko (npr. M).
Posplošujemo z vzorca na populacijo.
• ocenjevanje parametra Vprašanje: Kolikšen je parameter (m) v populaciji?
• testiranje hipotez Vprašanje: Ali je M pomembno različna od neke vrednosti?
Ocenjevanje parametra
• Navadno populacije (parametra) ne poznamo.
• Ocenjujemo ga na osnovi statistike vzorca.
• Standardna napaka = koliko napake v povprečju obstaja med vzorčno statistiko in neznanim populacijskim parametrom. – SE kot mera zanesljivosti (kaj bi bilo v drugih
vzorcih)
– z večanjem vzorca se SE manjša
Točkovna in intervalna ocena parametra
20
Točkovna ocena parametra
Vzorčna statistika je ocena populacijskega parametra.
nepristranska ocena (ni ne
previsoka ne prenizka, sredina vzorčne porazdelitve statistike je enaka ocenjevanemu parametru)
vse mere centralne tendence
proporci korelacijski koeficienti
pristranska
mere razpršenosti
1
σ'2
2
N
XX
N
XXSD
(toda pri majhnih vzorcih E(s‘) ni enaka populacijski s, ampak je od nje manjša 21
Intervalna ocena parametra
22
Intervalna ocena
parametra = razpon
vrednosti, znotraj katerega
se bo populacijski
parameter nahajal z
določeno verjetnostjo
Spodnja meja G
Zgornja meja G
Točkovna ocena G
interval zaupanja za G (npr. 90-odstotni interval zaupanja pri = 0,10)
p = / 2 / 2 1 -
SEG
Intervalna ocena parametra pri velikih vzorcih
Vzorčna porazdelitev statistike G je normalna. SE‘G je nepristranska.
23
Dopustna meja napake
SEG · zp
24
Ocenjevanje μ pri velikih vzorcih
Mp SEz m
Intervalno ocenjevanje M
pri velikih vzorcih
m
SEM
vzorčna porazdelitev M je N.D.
M
0
1
N (0,1)
M
pSE
Mz
m
z
22.11.2011
5
25
Ocenjevanje μ pri majhnih vzorcih
m
SEM
Vzorčna porazdelitev M je N.D. le,
če je frekvenčna porazdelitev
spremenljivke normalna.
preveriti
Natančnost SE‘M se spreminja z
velikostjo vzorca. Vzorčna
porazdelitev je odvisna od
stopenj prostosti.
0
1
M
pSE
Mt
m
Xp SEtX
Interval zaupanja za m:
df = N - 1
Prikazi standardne napake (angl. standard error bar)
26
Prikazi intervalov zaupanja (angl. confidence interval, CI)
Ocenjevanje σ
pzSE
NSE
σX
Xσ
σ'
2
σ'
(Grob) približek intervala zaupanja za s v primeru normalno porazdeljene spremenljivke in velikih vzorcev (N > 100)
2
p1
2
X
2
p
2
X
χ
σ')1(
χ
σ')1(
N
N
df = N-1
sp. meja IZ za varianco:
zg. meja IZ za varianco:
c21-p c2
p
2
22
σ
σ')1(χ
N
27 28
Kaj nam torej pove k-odstotni interval zaupanja? Če bi iz populacije potegnili nešteto vzorcev in na vsakem vzorcu izdelali k-odstotni interval zaupanja za populacijski parameter, bi se pri k odstotkih vzorcev parameter v resnici nahajal izven tega intervala.
Testiranje hipotez
• Pri raziskovanju postavimo hipotezo.
• Oblikujemo H0 in H1.
• Razlikovati med dvema interpretacijama podatkov: – Če statistika vzorca ni enaka vrednosti, ki jo
predvideva H0, je to posledica slučaja, tj. napake vzorčenja.
– Razlika ni slučajna, ampak naš vzorec izhaja iz populacije, za katero H0 ne drži.
29
• Postavimo dve nasprotni si hipotezi (ničelno in alternativno).
Primer: H0: Povprečni IQ je enak 100 (m = 100).
H1: Povprečni IQ je različen od 100 (m 100).
• Konstruiramo vzorčno porazdelitev (pod predpostavko pravilnosti ničelne hipoteze) + določimo kritično regijo.
• Iz populacije izberemo vzorec.
• Primerjamo vzorčno statistiko s hipotetično vrednostjo (z vrednostjo H0).
Testiranje hipotez
100
SEM
odvisna od velikosti vzorca odvisna od razpršenosti v populaciji
30
22.11.2011
6
31
Če je vrednost testne statistike verjetna (se nahaja znotraj intervala zaupanja okrog vrednosti H0), H0 ohranimo.
Testiranje hipotez
Če je vrednost višja/nižja od zgornje/spodnje meje intervala zaupanja (pade v kritično regijo), H0 zavrnemo. (Pravilnost H0 je malo verjetna. Statistika našega vzorca
se od vrednosti H0 statistično pomembno razlikuje.)
Na osnovi vzorčne porazdelitve poznamo verjetnost pojavljanja določene vrednosti testne statistike.
0
1
tM tM 0
1
Testiranje hipotez
Mejo, ki loči „področje visoke verjetnosti“ od kritične regije, določimo na osnovi . : • Raven statistične pomembnosti oz. raven alfa napake je
verjetnost, da bo testna statistika padla v kritično regijo, četudi H0 drži.
• = (-odstotno) tveganje za neustrezno zavrnitev H0 • Izberemo jo vnaprej. • = 0,05 (5 %), = 0,01 (1 %), = 0,001 (0,1 %) • Je arbitrarno določena.
32
33
Ocenjevanje parametra vs. testiranje hipotez
zG
1
zkrit zkrit 0
0
1
zG
zG > zkrit. zkrit zkrit
Napake pri statističnem odločanju
34
H0
r = 0) (M = m
H0
r 0) (M m
dejansko stanje
naš zaključek
pravilna potrditev ničelne hipoteze
napaka
pravilna zavrnitev ničelne hipoteze
b napaka
H0
r 0) (M m
H0
r = 0) (M = m
35
Napake pri statističnem zaključevanju
z
G
popvz
pSE
GGz
zkrit. zkrit. napaka
z
zkrit. zkrit. b napaka
dejansko stanje
ničelna hipoteza
• vrsta statistike
• nivo merjenja
• normalnost porazdelitve
• enakost varianc
• odvisni / neodvisni vzorci
• majhni / veliki vzorci
• vrednost ničelne hipoteze
izbor ustreznega testa
parametrični vs. neparametrični test 36
22.11.2011
7
Parametrični in neparametrični testi
• porazdelitev spremenljivke je v populaciji normalna
• če primerjamo med sabo več vzorcev: variabilnost spremenljivke je v različnih vzorcih podobna
• Intervalna ali razmernostna merska raven spremenljivke
• porazdelitev spremenljivke ni normalna (majhni vzorci?; omejenost razpona; U-porazdelitev pri stališčih)
• raznolike variabilnosti znotraj vzorcev
• ordinalna ali nominalna merska raven spremenljivke … Pri intervalnih ali razmernostnih spremenljivkah z neparametričnimi testi ne upoštevamo vseh informacij nižja moč testa (razliko, ki dejansko obstaja, težje potrdimo).
37 38
39
Testiranje hipotez
Povprečja
N.D.
parametrični testi
1 vzorec 2 vzorca
neodvisna odvisna
t test (independent
t test (paired-samples)
t test (one-sample)
več vzorcev
neodvisnih odvisnih
enosmerna
ANOVA (GLM - univariate)
enosmerna
ANOVA (GLM -
repeated-measures) 40
Testiranje hipotez
Povprečja
ni N.D.
neparametrični testi
1 vzorec 2 vzorca
neodvisna odvisna
- Mann-
Whitneyev
U
- medianski test
- Wilcoxonov
T test (matched pairs)
- test predznakov
binomski
test
več vzorcev
neodvisnih odvisnih
- Kruskal-
Wallisov H
- razširjeni
medianski test
Friedmanov
test
41
Testiranje hipotez
o varianci
• en vzorec: c2
• dva vzorca: F test
• dva ali več vzorcev: Levenov test
NOMINALNE SPREMENLJIVKE
t test razlike med deleži
c2 test
o obliki porazdelitve - χ2 test - preverjanje N.D.: χ2 test test Kolmogorova-Smirnova Shapiro-Wilkov test
o povezanosti - t test za testiranje H0: r = 0 - Fisherjeva transformacija in z test za testiranje H0: r = X
2
2
2
1
2
22 ˆ)1(
s
s
s
sc
F
N
r
zrzz
r
Nrt
s
m
21
2
42
Previdnost!
• pomembna mesta
• Interpretacija izsledka naj upošteva značilnosti raziskovalnega načrta.
• Ni statistično pomembno = ni dokazano.
Če ničelne hipoteze ne zavrnemo, to še ne pomeni, da je pravilna. Pri
opazovanem pojavu ni bilo tako izrazitega učinka NV, da bi ga zaznali, kar ne pomeni, da zagotovo ne obstaja.
• Statistična pomembnost: relativen pojem, vezan na verjetnostno teorijo, raste z velikostjo vzorca.
------- Pregledati velikost učinka
22.11.2011
8
43
Primeri osnovne literature
• Ferguson, G. A. (1998). Statistical analysis in psychology and education (3.izd.). New York: McGraw-Hill.
• Graveter, F.J., in Wallnau, L.B. (2009). Statistics for the Behavioral Sciences (8.izd.). Belmont, CA: Wadsworth/Thomson Learning.
• Petz, B. (1997). Osnovne statističke metode za nematematičare (3. izd.). Jastrebarsko: Naklada Slap. prihaja nova izdaja
• Povezave na: http://psy.ff.uni-lj.si/Katedre/psimet/