Imties dydis (apimtis, imties tūris, tiriamųjų skaičius, angl. sample size ) Tyrimo galia

34
Imties dydis (apimtis, imties tūris, tiriamųjų skaičius, angl. sample size) Tyrimo galia

description

Imties dydis (apimtis, imties tūris, tiriamųjų skaičius, angl. sample size ) Tyrimo galia. Optimalus skaičius. Pakankamai didelė imtis (moksliniai ar klinikiniai efektai turi būti svarūs, galia 1 ) - PowerPoint PPT Presentation

Transcript of Imties dydis (apimtis, imties tūris, tiriamųjų skaičius, angl. sample size ) Tyrimo galia

Imties dydis(apimtis, imties tūris, tiriamųjų skaičius, angl. sample size)

Tyrimo galia

Optimalus skaičius

• Pakankamai didelė imtis (moksliniai ar klinikiniai efektai turi būti svarūs, galia1)

1 – (power) Sugebėjimas nustatyti skirtumą ar ryšį tikrinant hipotezę, kai jis iš tikrųjų egzistuoja populiacijoje.

• Ne per didelė imtis (nešvaistomi resursai nesvarbaus efekto radimui)

Hipotezės tikrinimas – priminimas, reziumė

• Statistinis ryšio įvertinimas

• Pagal nulinę hipotezę

• Suskaičiuojama statistika (kiek nutolę nuo H0): t, F ar X2 --- P reikšmė

Hipotezės tikrinimas

4 išvados iš hipotezės tikrinimo:• Teisingas skirtumo radimas (atmetama H0 -

pripažįstamas kaltu)• Teisingas skirtumo neradimas (neatmetama H0,

išteisinamas, nekaltas)• α arba I tipo klaida, randam skirtumą/ryšį kai jo

nėra, t.y. atmetam H0 (klaidingai teigiamas - pripažįstamas kaltu, kai nekaltas)

• β arba II tipo klaida, nerandam skirtumo/ryšio, kai jis yra, t.y. NEatmetam H0 (klaidingai neigiamas - išteisinamas, kai yra kaltas)

Hipotezių tikrinimo klaidos

H0 -teisinga H0 -neteisinga

Paneigti H0

I rūšies klaida:

Paneigti H0, kai ji yra teisinga(pripažįstamas kaltu, nors nekaltas – klaidingai teigiamas)

Teisingas sprendimas (pripažįstamas kaltu)

Neatmesti H0Teisingas sprendimas(išteisinamas)

II rūšies klaida:

Neatmesti H0, kai ji yra neteisinga(išteisinamas, nors kaltas – klaidingai neigiamas)

I rūšies klaida

0

Tikim

ybių tankis

α/2 α/2

I klaida

0

Tikim

ybių tankis

μ0

X X

Sąryšis tarp I ir II klaidos

Mažinant I klaidos tikimybę, didėja II klaidos tikimybė

0

Tikim

ybių tankis

0,32α/2 α/2

II klaidaI klaida

0

Tikim

ybių tankis

0,32

μAμ0

II klaida

Sąryšis tarp I ir II klaidos

Sumažinus H0 ir H1 tikrinamų parametrų skirtumą, II klaidos tikimybė didėja

0

Tikim

ybių tankis

0,23α/2 α/2

II klaidaI klaida

Problemos su hipotezių tikrinimo klaidomis

• Klaidų sąryšis:

kuo mažesnė pirmos klaidos tikimybė α →0 (paneigti teisingą H0) tuo didesnė II klaidos tikimybė, (priimti neteisingą H0)

kuo mažesnis skirtumas tarp tikrinamų įverčių (∆ ir ∆1 , tuo didesnė II klaidos tikimybė)

Problemų sprendimo būdai:

• Didinti imties dydį (taip mažėja abiejų rūšių klaidos)

• Formuluoti išvadas apie atmetamą H0, tačiau neformuluoti išvados apie priimamą (neatmetamą) H0. Tai būdas išvengti II klaidos.Atmetame H0, kai testo reikšmė > k (kritinė

reikšmė) arba P < 0,05

Negalime atmesti H0, kai testo reikšmė < k (kritinė reikšmė) arba P > 0,05

Galia

• Susijusi su II tipo klaida (1-β)

• Galia – tai

– sugebėjimas nustatyti skirtumą/ryšį hipotezių vertinimu, kai tas skirtumas/ryšys iš tikrųjų egzistuoja populiacijoje.

– tikimybė pagrįstai atmesti neteisingą H0 hipotezę, randant statistinį reikšmingumą.

Pavyzdys• Vaiko pasiuntimas į rūsį atnešti įrankį

• Tikimybė – Kokia tikimybė, kad įrankis rūsyje?Teisingiau – Jei įrankis rūsyje, kokia tikimybė, kad vaikas jį ras?

• Atsakymas є nuo:– Kiek laiko užtruko ieškodamas?– Kokio dydžio įrankis– Ar didelė betvarkė rūsyje?

Kaip tai susiję?• Įrankis = efektas/skirtumas.• Paieškos laikas = imties dydžiui.

Daugiau duomenų didesnė galia rasti skirtumą/efektą.

• Įrankio dydis = ieškomam skirtumo/efekto dydžiui.Visada didesnė galia nustatant didelį efektą, negu mažą.

• Betvarkė rūsyje = duomenų sklaidai.Jei duomenys labai išsibarstę, turim mažiau galios nustatyti efektą.

Pavyzdžio reziume• Jei imties dydis didelis, ieškomas didelis efektas,

o stebėjimų sklaida maža, didelė tikimybė, kad rasite “statistiškai reikšmingą efektą”, jei toks egzistuoja visumoje. ARBA galėsite būti gan tikri savo išvada “efektas nebuvo statistiškai reikšmingas”.

• Bet jei imties dydis mažas, ieškomas mažas efektas, o stebėjimų sklaida didelė, tada išvada “efektas nebuvo statistiškai reikšmingas” nėra naudinga. ČIA IR GALIMA PADARYTI I IR II RŪŠIES KLAIDAS

Galia

0

Tikim

ybių tankis

0,32α/2 α/2

II klaidaI klaida

0

Tikim

ybių tankis

0,32

μAμ0

II klaida Galia

Galia

Skirtumui sumažėjus, galia mažėja.

0

Tikim

ybių tankis

0,23α/2 α/2

II klaidaI klaida

Galia

GaliaSumažinus μ0 ir μ1 tikrinamų parametrų skirtumus, II

klaidos tikimybė didėja, galia mažėja

0

Tikim

ybių tankis

0,12

Galia

μ0 : ∆∆ =0 μA : ∆∆ =0.12

Galios didinimo būdai• Imties dydžio padidinimas (jei neįmanoma

bendrai, tai gal vienos grupės, kuri pigiau). • Sklaidos sumažinimas (lyginant vidurkius),

naudojant tolygesnes (homogeniškesnes). • Kai kurie kompromisai:

– α padidinimas (α – slenkstis, už kurio rezultatus laikote “statistiškai reikšmingais”). Įprasta 0,05, galite rinktis pvz. 0,10. Taip padidinsite galią nustatyti efektą, bet kartu klaidingai “reikšmingą”.

– Sprendimas - kiek svarbu efekto dydis. Visi tyrimai turi daugiau galios didesniam efektui, o ne mažesniam.

Galia - reziume

• Galia yra priešinga II klaidos tikimybei “1- galia” (II klaida)

• Mažinant I klaidos tikimybę α, didėja II klaidos tikimybė. Iš to seka, kad mažėja ir galia.

• Vienpusių hipotezių galia yra didesnė negu dvipusių.

• Galia mažėja (rodo PI), mažėjant skirtumui, imties dydžiui, efektui/skirtumui/ryšiui.didesnė galia leidžia tikslesnius įvertinimus, bet tada

reikalinga didesnė imtis.

• Priimtina 80%, dažnai didesnė (90%).

Kai kurie imties skaičiavimo būdai

Formulė(priklausomai nuo generalinės aibės)

• n = ____1____ Δ² + 1/ N

kur n - imties dydis Δ – paklaidos dydis (0,05) N – generalinės visumos dydis.

Jei N=151, tyrimo imtis - 109 respondentai

Formulės(Skaitmeniniams duomenims 1 imčiai)

• Jei skaičiuojama ne pagal generalinę aibę, ir turima žinių apie reiškinį, pvz. dispersiją:

n - atvejų skaičius atrankinėje grupėje, t.y. imties dydis;z - koeficientas, surandamas iš vadinamųjų Stjudento pasiskirstymo lentelių, ir

kuris pasirenkamas pagal tai, kokį patikimumą norime gauti, pavyzdžiui, kai patikimumas 95 proc. (p = 0,05), z = 1,96; kai patikimumas 99 proc. (p = 0,01), z = 2,6 (pastaba: dabartiniuose literatūros šaltiniuose skaičiuojant imties dydį vietoj simbolio t vartojamas simbolis z);

s — imties vidutinis kvadratinis (arba standartinis) nuokrypis (SD).Jis gali būti nustatomas1) remiantis anksčiau atliktais tyrimais arba literatūros šaltiniais;2) pagal pilotinio tyrimo rezultatus.Δ (delta) — leistinas netikslumas/paklaida, t.y. skirtumas tarp atrankinės grupės

ir generalinės visumos vidurkio, laisvai pasirenkamas, atsižvelgiant į ankstesnių tyrimų duomenis bei duomenų tikslumui keliamus reikalavimus (dažnai 0,01-0,05).

Formulės(Kategoriniams duomenims 1 imčiai)

• Apklausos; kategoriniai duomenys

• Dėl to ir apklausų metu būtini bandomieji tyrimai, kurie dažnai būna viena iš priemonių imties dydžiui nustatyti.

• Taikoma ta pati formulė, tik sigma (s) apskaičiuojama pagal formulę:

S2 = p× (1 −p)

kur p - bandomojo tyrimo metu nustatytas kokybinis rodiklis

Formulės(Kategoriniams duomenims 1 imčiai)

IMTIES DYDŽIO NUSTATYMAS, jei pvz. paplitimas 4%

S2 = 0,04×(1−0,04) = 0,0384z = 1,96Δ = 0,05n = 59

Formulės(Kategoriniams duomenims 1 anketai+kai

daug klausimų)• Apklausos; daug klausimų; dydis kiekvienam klausimui

Bendras imties dydis nustatomas pagal didžiausią reikšmę.

Pvz. nustatyta, kad pirmo klausimo vienam atsakymų variantui reikia 100 tiriamųjų, kitam - 80 ir t.t. Antro ir trečio klausimo analogiškai 110 ir 150. Lygiai taip pat ir kitiems anketos klausimams. Bendras tiriamųjų skaičius, remiantis šiame pavyzdyje didžiausia reikšme, būtų 150.

• Tiriamųjų skaičius pagal kelis pagrindinius anketos klausimus.

Formulės(Kategoriniams duomenims 1 anketai+kai

daug klausimų)

• IMTIES DYDŽIO NUSTATYMAS

S2 = 0,54×(1−0,54) = 0,2484z =1,96Δ = 0,05n = 382.

Formulės(2 imtims)

Kategoriniams duomenims

N = 2* (zα+zβ) ² * p (1- p) / (d)²p – numatoma dalis

Zα =1,96, zβ = 0,84 (jei II tipo klaida 20%, galia 80%)

d – numatomas skirtumas

p (1-p) = 0,54×(1−0,54) = 0,2484d = 0,1n = 390 x 2 gr. = 760 iš viso

Apskaičiavimas internete

Internete “sample size calculation/calculator” (+ online…)

Pvz.• http://www.raosoft.com/samplesize.html• http://www.dssresearch.com/toolkit/

sscalc/size.asp• PS – Power and sample size calculation

(įdiegiama)

• ir kt.

Kodėl reikia skaičiuoti imties dydį?

• Ekonominės ir etinės priežastys:Nešvaistyti pinigų

Pvz. klinikiniuose tyrimuose kad nesukeltumėm žmonėms bereikalingo pavojaus (su maža galia, kai negalim gauti išvados)

• 80% galia priimtina, kai mažiau – rezultatai mažai reikšmingi

Reikalavimai planuojant imties dydį• Aiškiai apibrėžta, paprasta hipotezė:

– Geriausia viena pirminė hipotezė ir viena pirminė išeitis

– Kas yra išeitis (end point)

• Priimtinos I ir II tipo klaidos:– α = 0,05– β = 0,1-0,2

• Kliniškai, moksliškai reikšmingo efekto įvertis (mažiausias dydis kliniškai ar moksliškai reikšmingas)

Abs vs reliatyvūsTai nėra statistinis sprendimas • Išeities variabilumo įvertis (SD)

Efektas ir variabilumas

• Patirtis

• Literatūra

• Žvalgomasis tyrimas

• Variabilumas proporcijoms neturi reikšmės, nes variabilumas yra juose

Kiti klausimai

• Praradimai

• Daugybiniai palyginimai

• Tarpinės analizės

Prieš pradedant tyrimą, o ne po to

• Post-hoc galios skaičiavimas neturi prasmės

• Perteklinė info prie P reikšmės ir PI.

Reziume - video

http://alexholcombe.wordpress.com/2011/03/01/funny-video-about-p-values-and-statistical-power/