Vzorčenje in statistično zaključevanjepsy.ff.uni-lj.si/Katedre/PM/gradiva/RMP2-1-Pregled...

22.11.2011

1

Vzorčenje in statistično zaključevanje

Doktorski študij Humanistika in družboslovje, psihološke smeri

Raziskovalna metodologija v psihologiji

Izr. prof. dr. Anja Podlesek

2

Populacija in vzorec

• posploševanje z vzorca na populacijo

• opredelitev populacije in vzorca sestavljanje liste, s katere vzorčimo

• reprezentativnost, nepristranskost vzorec ima podobne lastnosti kot populacija (enakost deležev)

• velikost vzorca ekonomičen N, dopustna napaka vzorčenja, variabilnost pojava, pričakovana razlika, določitev N iz enačb za testiranje hipotez

3

Verjetnostno vzorčenje

• Naključno vzorčenje (lista elementov; vrečka, tabele naključnih števil, PC (Excel); reprezentativnost ni garantirana!)

• Stratificirano vzorčenje (razdelitev populacije na razrede, iz njih naključno / proporcionalno vzorčimo)

• Sistematično vzorčenje (naključno določen začetek, korak k elementov)

• Vzorčenje klastrov (naključen izbor klastra oziroma vzorčne enote, vzorec = vsi člani klastra)

• Večstopenjsko vzorčenje (določimo večje klastre, naključno izberemo nekaj klastrov, naključno vzorčimo iz posameznega klastra)

naključen izbor

vsak element ima enako možnost izbora v vzorec

visoka zunanja veljavnost

4

Druge tehnike vzorčenja

• Priložnostno vzorčenje (problem prostovoljnih udeležencev)

• Namensko vzorčenje (udeleženci imajo določene lastnosti): – vzorčenje pogostih primerov

– vzorčenje ekstremnih primerov oz. raznolikosti

– vzorčenje ekspertov

– kvotni vzorec

– vzorčenje po principu “snežne kepe”

5

Teorija vzorčenja

Spremenljivka

Statistika

Parameter

Napaka vzorčenja

Teorija vzorčenja

• Govori o odnosih med populacijo in vzorci, ki jih vlečemo iz nje.

• Če poznamo populacijo, lahko določimo verjetnost, da bomo iz nje potegnili specifičen vzorec (s specifično statistiko).

• Obratno delamo pri statističnem zaključevanju: izmerimo vzorec, sklepamo o populaciji.

populacija vzorec

verjetnost

statistično zaključevanje/ posploševanje/sklepanje ali inferenčna statistika (angl. statistical inference)

6

22.11.2011

2

7

Vzorčne porazdelitve

statistika statistika statistika

Vzorčna porazdelitev

… je porazdelitev statistike neskončnega števila vzorcev

Vzorci se razlikujejo.

8


• Če iz definirane populacije izberemo vse možne vzorce velikosti N, lahko za vsak vzorec določimo statistike (npr. M, SD). Statistike se od vzorca do vzorca spreminjajo. vzorčne porazdelitve statistik

– opisnih statistik vzorca, npr. M, var, p, r…

– drugih izrazov, npr.

• Vsako vzorčno porazdelitev lahko opišemo: Mstatistike SD = SEstatistike

21

21

MMSE

MM

9


Mstatistike

SEstatistike

M

SD

frekvenčna porazdelitev spremenljivke

vzorčna porazdelitev statistike za manjše / večje vzorce

Če je vzorec velik, bo statistika vzorca bolj podobna parametru. Razpršenost vzorčne porazdelitve se z večanjem vzorca manjša.

10

NSE

σσ MM

SEM = standardni odklon vzorčnih

aritmetičnih sredin

= standardna napaka ocene m

NSE

2

σσ

N

ppSE

)1(p

Standardna napaka

Standardna napaka se z večanjem vzorca manjša.

Verjetnost pojavljanja vzorčne statistike pri velikih vzorcih

• Če poznamo parameter v populaciji, lahko:

– določimo verjetnost pojavljanja določene vrednosti vzorčne statistike.

𝑧 =𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑘𝑎−𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑒𝑟

𝑆𝐸statistike p

– določimo interval vrednosti statistike, ki jo pričakujemo v srednjih k % vzorcev.

11 12

Gpop

SEG

vzorčna porazdelitev G je N.D.

Gvz

0

1

N (0,1)

G

popvz

pSE

GGz

z

Verjetnost pojavljanja vzorčne statistike pri velikih vzorcih

22.11.2011

3

Vzorčna porazdelitev aritmetične sredine

NSE

σσ MM SEM v primeru neskončnih populacij

ali vzorčenja z vračanjem

1

σσ MM

p

p

N

NN

NSE

SEM v primeru končnih populacij Np … velikost populacije N … velikost vzorca Enačba velja, ko je Np > N.

Korekcija za končnost populacije

𝜇M

σM=SEM = SEM

E(M) = m

μM = μ

Iz zakona velikih števil sledi, da je, če iz

populacije naključno izberemo vzorec

velikosti N, pričakovana vrednost aritmetične

sredine vzorca (M) enaka populacijski

sredini (μ).

13

Vzorčna porazdelitev aritmetične sredine

• Je pri velikih vzorcih asimptotično normalna, ne glede na to, kakšna je porazdelitev spremenljivke v populaciji (centralni limitni izrek).

• Tudi pri majhnih vzorcih je normalna, če se spremenljivka v populaciji porazdeljuje normalno. Če se ne, vzorčna porazdelitev sredin majhnih vzorcev ni normalna. preveriti normalnost porazdelitve spremenljivke v populaciji!

• Pri velikih vzorcih je s‘ zelo verjetno zelo blizu pravi vrednosti s, in zato je tudi SEstatistike zelo blizu pravi SD cenilk.

• Pri majhnih vzorcih, če ne poznamo variance spremenljivke v populaciji (oz. s), je izračun SE statistike bolj negotov – SE‘M, izračunana po predstavljenih enačbah za velike vzorce, je pristranska ocena populacijske standardne napake (jo podcenjuje).

14

• Studentova t porazdelitev: pri ocenjevanju aritmetične sredine spremenljivke, ki se v populaciji normalno porazdeljuje, ko imamo opravka z majhnimi vzorci in ne poznamo s

df = ∞ z df = 30

15

Vzorčne porazdelitve pri majhnih vzorcih

Prostostne stopnje

• angl. degrees of freedom df

• df = število vrednosti pri končnem izračunu statistike, ki lahko prosto variirajo (= št. neodvisnih podatkov – št. predhodno ocenjenih parametrov)

X = 1, 2, 3

• 𝑀 = 𝑋

𝑁= 2 vključeni trije neodvisni kosi informacije

• 𝑣𝑎𝑟 = 𝑋−μ 2

𝑁= 2/3 vključena dva neodvisna kosa

informacije (N-1) pred tem smo ocenili μ

16


Če iz normalno porazdeljene populacije s standardno deviacijo s potegnemo N podatkov in izračunamo zgornjo statistiko (odklone računamo od vzorčne M), se ta porazdeljuje po c2 porazdelitvi z df=N-1.

2

2

2

22

2

22

2

2

1

2

2

1

2

2

1 i

ii2

σ

σ')1(

σχ

σ

)(...)()(

σχ

σ

μχ

NSDN

MXMXMXSS

zX

N

N

i

i

N

i

17

df = N

df = N – 1

df = N – 1

Z večanjem df se c2 porazdelitev približuje normalni.


Če se vzorec 1 veča proti neskončnemu, se F-porazdelitev približuje hi-kvadrat porazdelitvi z df=N2-1. Z večanjem obeh vzorcev proti neskončnemu N se F-porazdelitev približuje normalni.

18

1χ

1χ

σ1

σ1

1ˆ

σˆ

σˆ

2

2

2

1

2

1

2

22

2

22

2

11

2

11

j

2

jj2

j

2

2

2

2

2

1

2

1

N

N

NSDN

NSDNF

N

SDNs

s

sF

F porazdelitev se pojavi pri primerjavi varianc dveh vzorcev.

Oblika F porazdelitve je odvisna od dveh df, in sicer od df, vezane na števec, in df, vezane na imenovalec zgornje enačbe: df1= N1-1, df2 = N2-1.


22.11.2011

4

19

Statistično zaključevanje

Izberemo vzorec.

Določimo statistiko (npr. M).

Posplošujemo z vzorca na populacijo.

• ocenjevanje parametra Vprašanje: Kolikšen je parameter (m) v populaciji?

• testiranje hipotez Vprašanje: Ali je M pomembno različna od neke vrednosti?

Ocenjevanje parametra

• Navadno populacije (parametra) ne poznamo.

• Ocenjujemo ga na osnovi statistike vzorca.

• Standardna napaka = koliko napake v povprečju obstaja med vzorčno statistiko in neznanim populacijskim parametrom. – SE kot mera zanesljivosti (kaj bi bilo v drugih

vzorcih)

– z večanjem vzorca se SE manjša

Točkovna in intervalna ocena parametra

20

Točkovna ocena parametra

Vzorčna statistika je ocena populacijskega parametra.

nepristranska ocena (ni ne

previsoka ne prenizka, sredina vzorčne porazdelitve statistike je enaka ocenjevanemu parametru)

vse mere centralne tendence

proporci korelacijski koeficienti

pristranska

mere razpršenosti

1

σ'2

2

N

XX

N

XXSD

(toda pri majhnih vzorcih E(s‘) ni enaka populacijski s, ampak je od nje manjša 21

Intervalna ocena parametra

22

Intervalna ocena

parametra = razpon

vrednosti, znotraj katerega

se bo populacijski

parameter nahajal z

določeno verjetnostjo

Spodnja meja G

Zgornja meja G

Točkovna ocena G

interval zaupanja za G (npr. 90-odstotni interval zaupanja pri = 0,10)

p = / 2 / 2 1 -

SEG

Intervalna ocena parametra pri velikih vzorcih

Vzorčna porazdelitev statistike G je normalna. SE‘G je nepristranska.

23

Dopustna meja napake

SEG · zp

24

Ocenjevanje μ pri velikih vzorcih

Mp SEz m

Intervalno ocenjevanje M

pri velikih vzorcih

m

SEM

vzorčna porazdelitev M je N.D.

M

0

1

N (0,1)

M

pSE

Mz

m

z

22.11.2011

5

25

Ocenjevanje μ pri majhnih vzorcih

m

SEM

Vzorčna porazdelitev M je N.D. le,

če je frekvenčna porazdelitev

spremenljivke normalna.

preveriti

Natančnost SE‘M se spreminja z

velikostjo vzorca. Vzorčna

porazdelitev je odvisna od

stopenj prostosti.

0

1

M

pSE

Mt

m

Xp SEtX

Interval zaupanja za m:

df = N - 1

Prikazi standardne napake (angl. standard error bar)

26

Prikazi intervalov zaupanja (angl. confidence interval, CI)

Ocenjevanje σ

pzSE

NSE

σX

Xσ

σ'

2

σ'

(Grob) približek intervala zaupanja za s v primeru normalno porazdeljene spremenljivke in velikih vzorcev (N > 100)

2

p1

2

X

2

p

2

X

χ

σ')1(

χ

σ')1(

N

N

df = N-1

sp. meja IZ za varianco:

zg. meja IZ za varianco:

c21-p c2

p

2

22

σ

σ')1(χ

N

27 28

Kaj nam torej pove k-odstotni interval zaupanja? Če bi iz populacije potegnili nešteto vzorcev in na vsakem vzorcu izdelali k-odstotni interval zaupanja za populacijski parameter, bi se pri k odstotkih vzorcev parameter v resnici nahajal izven tega intervala.

Testiranje hipotez

• Pri raziskovanju postavimo hipotezo.

• Oblikujemo H0 in H1.

• Razlikovati med dvema interpretacijama podatkov: – Če statistika vzorca ni enaka vrednosti, ki jo

predvideva H0, je to posledica slučaja, tj. napake vzorčenja.

– Razlika ni slučajna, ampak naš vzorec izhaja iz populacije, za katero H0 ne drži.

29

• Postavimo dve nasprotni si hipotezi (ničelno in alternativno).

Primer: H0: Povprečni IQ je enak 100 (m = 100).

H1: Povprečni IQ je različen od 100 (m 100).

• Konstruiramo vzorčno porazdelitev (pod predpostavko pravilnosti ničelne hipoteze) + določimo kritično regijo.

• Iz populacije izberemo vzorec.

• Primerjamo vzorčno statistiko s hipotetično vrednostjo (z vrednostjo H0).

Testiranje hipotez

100

SEM

odvisna od velikosti vzorca odvisna od razpršenosti v populaciji

30

22.11.2011

6

31

Če je vrednost testne statistike verjetna (se nahaja znotraj intervala zaupanja okrog vrednosti H0), H0 ohranimo.

Testiranje hipotez

Če je vrednost višja/nižja od zgornje/spodnje meje intervala zaupanja (pade v kritično regijo), H0 zavrnemo. (Pravilnost H0 je malo verjetna. Statistika našega vzorca

se od vrednosti H0 statistično pomembno razlikuje.)

Na osnovi vzorčne porazdelitve poznamo verjetnost pojavljanja določene vrednosti testne statistike.

0

1

tM tM 0

1

Testiranje hipotez

Mejo, ki loči „področje visoke verjetnosti“ od kritične regije, določimo na osnovi . : • Raven statistične pomembnosti oz. raven alfa napake je

verjetnost, da bo testna statistika padla v kritično regijo, četudi H0 drži.

• = (-odstotno) tveganje za neustrezno zavrnitev H0 • Izberemo jo vnaprej. • = 0,05 (5 %), = 0,01 (1 %), = 0,001 (0,1 %) • Je arbitrarno določena.

32

33

Ocenjevanje parametra vs. testiranje hipotez

zG

1

zkrit zkrit 0

0

1

zG

zG > zkrit. zkrit zkrit

Napake pri statističnem odločanju

34

H0

r = 0) (M = m

H0

r 0) (M m

dejansko stanje

naš zaključek

pravilna potrditev ničelne hipoteze

napaka

pravilna zavrnitev ničelne hipoteze

b napaka

H0

r 0) (M m

H0

r = 0) (M = m

35

Napake pri statističnem zaključevanju

z

G

popvz

pSE

GGz

zkrit. zkrit. napaka

z

zkrit. zkrit. b napaka

dejansko stanje

ničelna hipoteza

• vrsta statistike

• nivo merjenja

• normalnost porazdelitve

• enakost varianc

• odvisni / neodvisni vzorci

• majhni / veliki vzorci

• vrednost ničelne hipoteze

izbor ustreznega testa

parametrični vs. neparametrični test 36

22.11.2011

7

Parametrični in neparametrični testi

• porazdelitev spremenljivke je v populaciji normalna

• če primerjamo med sabo več vzorcev: variabilnost spremenljivke je v različnih vzorcih podobna

• Intervalna ali razmernostna merska raven spremenljivke

• porazdelitev spremenljivke ni normalna (majhni vzorci?; omejenost razpona; U-porazdelitev pri stališčih)

• raznolike variabilnosti znotraj vzorcev

• ordinalna ali nominalna merska raven spremenljivke … Pri intervalnih ali razmernostnih spremenljivkah z neparametričnimi testi ne upoštevamo vseh informacij nižja moč testa (razliko, ki dejansko obstaja, težje potrdimo).

37 38

39

Testiranje hipotez

Povprečja

N.D.

parametrični testi

1 vzorec 2 vzorca

neodvisna odvisna

t test (independent

t test (paired-samples)

t test (one-sample)

več vzorcev

neodvisnih odvisnih

enosmerna

ANOVA (GLM - univariate)

enosmerna

ANOVA (GLM -

repeated-measures) 40

Testiranje hipotez

Povprečja

ni N.D.

neparametrični testi

1 vzorec 2 vzorca

neodvisna odvisna

- Mann-

Whitneyev

U

- medianski test

- Wilcoxonov

T test (matched pairs)

- test predznakov

binomski

test

več vzorcev

neodvisnih odvisnih

- Kruskal-

Wallisov H

- razširjeni

medianski test

Friedmanov

test

41

Testiranje hipotez

o varianci

• en vzorec: c2

• dva vzorca: F test

• dva ali več vzorcev: Levenov test

NOMINALNE SPREMENLJIVKE

t test razlike med deleži

c2 test

o obliki porazdelitve - χ2 test - preverjanje N.D.: χ2 test test Kolmogorova-Smirnova Shapiro-Wilkov test

o povezanosti - t test za testiranje H0: r = 0 - Fisherjeva transformacija in z test za testiranje H0: r = X

2

2

2

1

2

22 ˆ)1(

s

s

s

sc

F

N

r

zrzz

r

Nrt

s

m

21

2

42

Previdnost!

• pomembna mesta

• Interpretacija izsledka naj upošteva značilnosti raziskovalnega načrta.

• Ni statistično pomembno = ni dokazano.

Če ničelne hipoteze ne zavrnemo, to še ne pomeni, da je pravilna. Pri

opazovanem pojavu ni bilo tako izrazitega učinka NV, da bi ga zaznali, kar ne pomeni, da zagotovo ne obstaja.

• Statistična pomembnost: relativen pojem, vezan na verjetnostno teorijo, raste z velikostjo vzorca.

------- Pregledati velikost učinka

22.11.2011

8

43

Primeri osnovne literature

• Ferguson, G. A. (1998). Statistical analysis in psychology and education (3.izd.). New York: McGraw-Hill.

• Graveter, F.J., in Wallnau, L.B. (2009). Statistics for the Behavioral Sciences (8.izd.). Belmont, CA: Wadsworth/Thomson Learning.

• Petz, B. (1997). Osnovne statističke metode za nematematičare (3. izd.). Jastrebarsko: Naklada Slap. prihaja nova izdaja

• Povezave na: http://psy.ff.uni-lj.si/Katedre/psimet/

Vzorčenje in statistično zaključevanjepsy.ff.uni-lj.si/Katedre/PM/gradiva/RMP2-1-Pregled...

Documents

Transcript of Vzorčenje in statistično zaključevanjepsy.ff.uni-lj.si/Katedre/PM/gradiva/RMP2-1-Pregled...