Tilastomenetelmät psykiatrisessa epidemiologiassa

78
Tilastomenetelmät psykiatrisessa epidemiologiassa Jouko Miettunen, FT 9.10.2007 Psykiatrian klinikka

description

Tilastomenetelmät psykiatrisessa epidemiologiassa. Jouko Miettunen, FT 9.10.2007 Psykiatrian klinikka. Esitelmän aiheet. Perusmenetelmiä Ristiintaulukkojen testaaminen Jakaumien tunnusluvut ja testaaminen Korrelaatiokertoimet Monimuuttujamenetelmiä Regressioanalyysit Elinaika-analyysi - PowerPoint PPT Presentation

Transcript of Tilastomenetelmät psykiatrisessa epidemiologiassa

Page 1: Tilastomenetelmät psykiatrisessa epidemiologiassa

Tilastomenetelmät psykiatrisessa epidemiologiassa

Jouko Miettunen, FT

9.10.2007 Psykiatrian klinikka

Page 2: Tilastomenetelmät psykiatrisessa epidemiologiassa

Esitelmän aiheetPerusmenetelmiä Ristiintaulukkojen testaaminen Jakaumien tunnusluvut ja testaaminen KorrelaatiokertoimetMonimuuttujamenetelmiä Regressioanalyysit Elinaika-analyysi Varianssianalyysit Faktorianalyysit Muita menetelmiä(Luotettavuuden arviointi)Tilasto-ohjelmatKirjallisuutta

Page 3: Tilastomenetelmät psykiatrisessa epidemiologiassa

Perusmenetelmiä

Page 4: Tilastomenetelmät psykiatrisessa epidemiologiassa

Luokitellut muuttujat Jakaumien vertailu ryhmien välillä Tilastollinen testaaminen

Khiin neliötesti, OR, RR

Jatkuvat muuttujat Keskiarvojen vertailu ryhmien välillä

Studentin t-testi Mediaanien vertailu ryhmien välillä

Mann-Whitneyn U-testi Kruskal-Wallisin testi

Korrelaatiokertoimet

Page 5: Tilastomenetelmät psykiatrisessa epidemiologiassa

Jatkuva vai luokiteltu muuttuja?

Luokittelemalla menetetään tietoa Usein kuitenkin selkeyttää tulosten

esittämistä Analyysimenetelmät erilaisia

Page 6: Tilastomenetelmät psykiatrisessa epidemiologiassa

Luokittelutapoja

Aiemmat tutkimukset Kliiniset kriteerit Aineistoon perustuvat

Mediaani, kvartiilit, alin/ylin 10%, jne. Keskiarvo Keskiarvo ± 2 keskihajontaa

Page 7: Tilastomenetelmät psykiatrisessa epidemiologiassa

Ristiintaulukkojen testaaminen

2 –testi Fisherin tarkka testi (Fisher’s exact test)

Epidemiologiassa erityisesti käytössä vetosuhde, ristitulosuhde (odds ratio) riskisuhde (risk ratio)

Page 8: Tilastomenetelmät psykiatrisessa epidemiologiassa

Pohjois-Suomen 1966 syntymäkohortti Seisomaan oppiminen ja myöhempi

psykoottinen sairaus Jatkoanalyysi psykoosipotilaiden joukossa

Onko sukurasituksella merkitystä?

Esimerkki

Page 9: Tilastomenetelmät psykiatrisessa epidemiologiassa

2 –testi

Chi-Square Tests

12,802a 2 ,002

12,658 2 ,002

12,759 1 ,000

9609

Pearson Chi-Square

Likelihood Ratio

Linear-by-LinearAssociation

N of Valid Cases

Value dfAsymp. Sig.

(2-sided)

0 cells (,0%) have expected count less than 5. Theminimum expected count is 34,63.

a.

Age at standing unsupported * Psychotic disorder until 2001

4074 40 4114

99,0% 1,0% 100,0%

2430 35 2465

98,6% 1,4% 100,0%

2970 60 3030

98,0% 2,0% 100,0%

9474 135 9609

98,6% 1,4% 100,0%

Count

Count

Count

Count

- 10 months

11 months

12 months +

Age at standingunsupported

Total

healthy any psychosis

Psychotic disorder until2001

Total

Page 10: Tilastomenetelmät psykiatrisessa epidemiologiassa

Fisherin tarkkatesti

Chi-Square Tests

,951a 2 ,622 ,620

,969 2 ,616 ,620

,800 ,793

,752b

1 ,386 ,476 ,274 ,142

56

Pearson Chi-Square

Likelihood Ratio

Fisher's Exact Test

Linear-by-LinearAssociation

N of Valid Cases

Value dfAsymp. Sig.

(2-sided)Exact Sig.(2-sided)

Exact Sig.(1-sided)

PointProbability

3 cells (50,0%) have expected count less than 5. The minimum expected count is 1,45.a.

The standardized statistic is ,867.b.

- Pienille otoksille- Jos väh. 25 prosentissa soluista odotettu arvo on alle 5

Age at standing unsupported * Any psychotic 1st degree relative

8 1 9

88,9% 11,1% 100,0%

16 2 18

88,9% 11,1% 100,0%

23 6 29

79,3% 20,7% 100,0%

47 9 56

83,9% 16,1% 100,0%

Count

Count

Count

Count

- 10 months

11 months

12 months +

Age at standingunsupported

Total

no yes

Any psychotic 1stdegree relative

Total

Page 11: Tilastomenetelmät psykiatrisessa epidemiologiassa

Assosiaation mittaaminen epidemiologiassa

Absoluuttinen Riskiero (risk difference)

Altistunut – ei-altistunut Suhteellinen

Riskisuhde (risk ratio, relative risk, RR) Ristitulosuhde tai vetosuhde (odds ratio, OR)

Altistunut / ei-altistunut Eivät kerro sellaisenaan kausaliteetista

Page 12: Tilastomenetelmät psykiatrisessa epidemiologiassa

a / (a + b)c / (c + d)=Riskisuhde, RR

Tauti

Altiste Kyllä Ei Yhteensä

Kyllä a b a + b

Ei c d c + d

Yhteensä a + c b + c a + b + c + d

a / bc / d=Odds Ratio, OR ad

bc=

Page 13: Tilastomenetelmät psykiatrisessa epidemiologiassa

24 / (24 + 459)132 / (132 + 10319)=RR

Lapsella psykoosi

Vanhemmalla psykoosi Kyllä Ei Yhteensä

Kyllä 24 (5.0%) 459 483

Ei 132 (1.3%) 10319 10451

Yhteensä 156 10451 10934

24 / 459132 / 10319=OR = 4.1

= 3.9

Page 14: Tilastomenetelmät psykiatrisessa epidemiologiassa

Odds Ratio (OR) vai Risk Ratio (RR)?

RR tarkempi riskin tunnuslukuna Mikäli yleinen sairaus tulisi käyttää RR:ää OR:ssä on helpompi ottaa huomioon

sekoittavat tekijät Mikäli harvinainen sairaus ja iso aineisto

OR ≈ RR

Page 15: Tilastomenetelmät psykiatrisessa epidemiologiassa

Jatkuvat muuttujat

Page 16: Tilastomenetelmät psykiatrisessa epidemiologiassa

Keskiarvo vai mediaani?

Keskiarvo soveltuu likimain normaalijakautuneelle aineistolle

Mikäli aineistossa on paljon poikkeavia arvoja tai se on huomattavan vino, mediaani kuvaa muuttujan jakaumaa paremmin

Page 17: Tilastomenetelmät psykiatrisessa epidemiologiassa

Normaaliuden arviointi Mikäli mediaani ja keskiarvo eroavat

huomattavasti toisistaan, jakauma ei ole normaalijakautunut

Huipukkuus (kurtosis) ja vinous (skewness) kuvaavat normaalisuutta

Normaaliuden testit eivät ole tehokkaita Kolmogorov-Smirnov testi Shapiro-Wilk testi (kun N<50)

Tärkein on kuitenkin visuaalinen arvio!

Page 18: Tilastomenetelmät psykiatrisessa epidemiologiassa

Muuttujien erilaisia jakaumia

Havainnot on kasaantunut oikealle (jakauma on negatiivisesti vino eli vino vasemmalle)

B on normaalijakautunut. A on positiivisesti huipukas jakaumaC negatiivisesti huipukas jakauma

Page 19: Tilastomenetelmät psykiatrisessa epidemiologiassa

Independent Samples Testa

16,149 ,000 2,530 5307 ,011 ,76781 ,30348 ,17286 1,36275

1,518 62,521 ,134 ,76781 ,50596 -,24343 1,77904

8,457 ,004 ,693 5339 ,488 44,80588 64,64790 -81,93042 171,54218

,476 63,708 ,636 44,80588 94,18373 -143,364 232,97614

Equal variancesassumed

Equal variancesnot assumed

Equal variancesassumed

Equal variancesnot assumed

height at birth

weight at birth

F Sig.

Levene's Test forEquality of Variances

t df Sig. (2-tailed)Mean

DifferenceStd. ErrorDifference Lower Upper

95% ConfidenceInterval of the

Difference

t-test for Equality of Means

sex = femalea.

Keskiarvojen vertailu: t-testiGroup Statisticsa

5246 49,8313 2,36884 ,03271

63 49,0635 4,00755 ,50490

5277 3421,6809 510,57590 7,02857

64 3376,8750 751,36886 93,92111

Functional psychosis;validated diagnosis -97(notes until 31.12.1997)no

yes

no

yes

height at birth

weight at birth

N Mean Std. DeviationStd. Error

Mean

sex = femalea.

Page 20: Tilastomenetelmät psykiatrisessa epidemiologiassa

Test Statisticsa

5126257

1E+007

-6,091

,000

Mann-Whitney U

Wilcoxon W

Z

Asymp. Sig. (2-tailed)

tassum

Grouping Variable: sexa.

Mediaanien vertailu: Mann-Whitneyn U-testi

Case Summaries

tassum

3293 49,0000 48,4376

3406 47,0000 47,3165

6699 48,0000 47,8676

sexboy

girl

Total

N Median Mean

Pohjois-Suomen 1986 syntymäkohortti 15-16 v.: Toronto Alexithymia Scale

Ranks

3293 3496,29 11513272,50

3406 3208,57 10928377,50

6699

sexboy

girl

Total

tassumN Mean Rank Sum of Ranks

Page 21: Tilastomenetelmät psykiatrisessa epidemiologiassa

Test Statisticsa,b

101,779

2

,000

Chi-Square

df

Asymp. Sig.

SCLDepression

mean

Kruskal Wallis Testa.

Grouping Variable: Educational level 1997b.

Mediaanien vertailu: Kruskal-Wallisin H-testiPohjois-Suomen 1966 syntymäkohortti: masennusoireet (SCL-25)

Ranks

857 4576,54

5072 4192,02

2273 3720,40

8202

Educational level1997 (register)Basic (<=9 yrs)

Secondary (10-12 yrs)

Tertiary (over 12 yrs)

Total

SCL Depression meanN Mean Rank

- Ei testaa varsinaisesti mediaaneja vaan koko jakauman sijaintia (suositeltavaa)- Varsinaisesti mediaaneja testataan esim. jakamalla koko aineisto mediaanista kahteen osaan ja verrataan jakaumia ryhmien välillä (esim. tässä koulutuksen mukaan) –testillä.

Page 22: Tilastomenetelmät psykiatrisessa epidemiologiassa

Korrelaatiokertoimet

Pearsonin korrelaatiokerroin Normaalijakautuneille muuttujille

Spearmanin korrelaatiokerroin Ei-normaalijakautuneille muuttujille Järjestyskorrelaatiokerroin (mean rank)

Tuloksia voi graafisesti esittää korrelaatiodiagrammin avulla

Page 23: Tilastomenetelmät psykiatrisessa epidemiologiassa

Korrelaatiodiagrammi

r = 0.75

Page 24: Tilastomenetelmät psykiatrisessa epidemiologiassa

Monimuuttujamenetelmät

Page 25: Tilastomenetelmät psykiatrisessa epidemiologiassa

Lineaarinen regressioanalyysi Selitetään jatkuvaa (tai ainakin välimatka-

asteikollista) muuttujaa Selittäviä muuttujia voi olla useita

Jatkuvia tai kaksiluokkaisia muuttujia Muuttujien välinen riippuvuus oletetaan

lineaariseksi Selittävät muuttujat ei saa liikaa korreloida

keskenään (multikollineaarisuus) Selitettävän muuttujan hajonta ei riipu

selittävien muuttujien hajonnasta (homoskedastisuus)

Page 26: Tilastomenetelmät psykiatrisessa epidemiologiassa

Kohortti 1966, 31 v. seuranta Alkoholin käytön (g/pv) ennustaminen Ennustavat muuttujat

Sukupuoli Siviilisääty (naimaton tai eronnut, ei/kyllä) Masennus

Jatkuva muuttuja (SCL-masennusoireet) Syntymäpaino

Jatkuva muuttuja (g)

Esimerkki

Page 27: Tilastomenetelmät psykiatrisessa epidemiologiassa

Coefficientsa

1,454 ,046 31,564 ,00000 1,364 1,544

-,302 ,011 -,295 -27,146 ,00000 -,324 -,280

,153 ,015 ,110 10,138 ,00000 ,123 ,182

,118 ,027 ,047 4,344 ,00001 ,065 ,171

,000 ,000 ,007 ,641 ,52133 ,000 ,000

(Constant)

sex

SCL Depression mean

divorced or widow at31yr study

weight at birth

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig. Lower Bound Upper Bound

95% Confidence Interval for B

Dependent Variable: Current use of alcohol (g/day) 31va.

EsimerkkiModel Summary

,306a ,094 ,093 ,48615Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), divorced or widow at 31yr study,sex, SCL Depression mean

a.

Page 28: Tilastomenetelmät psykiatrisessa epidemiologiassa

Logistinen regressioanalyysi Yleisin tapa ottaa huomioon sekoittavat

muuttujat, Erityisesti pitkittäistutkimuksissa Vastemuuttuja (outcome) on kaksiluokkainen

(esim. kyllä/ei) Altistemuuttujat (exposure) voivat olla sekä

kaksiluokkaisia, useampiluokkaisia että jatkuvia Multinomiaalisessa logistisessa

regressioanalyysissa vastemuuttujassa voi olla useita luokkia

Page 29: Tilastomenetelmät psykiatrisessa epidemiologiassa

Muuttujien valinta, esim. Aiemman tiedon tai ko. aineiston perusteella Sosiodemograafiset muuttujat, esim. sukupuoli,

sosiaaliluokka? Malliin mukaan aiemmin tunnetut sekoittavat

tekijät? Erityisesti jos vaikuttavat tuloksiin

Mukana ei saa olla liikaa muuttujia Riippuu aineiston koosta ja muuttujien jakaumista

Mukana ei kannata olla keskenään liikaa korreloivia muuttujia

Page 30: Tilastomenetelmät psykiatrisessa epidemiologiassa

Esimerkki

Pohjois-Suomen vuoden 1966 syntymäkohortti

N = 10 934 Runsaasti haastattelu- ja

rekisteridataa

Page 31: Tilastomenetelmät psykiatrisessa epidemiologiassa

Esimerkki

Mikä psykoottisilla potilailla ennustaa uutta sairaalahoitoa?

N = 158 Altistemuuttujat

sukupuoli Isän sosiaaliluokka (1980) Sukurasitus Sairastumisikä Ensimmäisen sairaalahoidon kesto diagnoosi (skitsofrenia / muu psykoosi)

Miettunen ym. Nord J Psychiatry 2006; 60: 286-93.

Page 32: Tilastomenetelmät psykiatrisessa epidemiologiassa

SPSS Output - muuttujat

Categorical Variables Codings

48 ,000 ,00096 1,000 ,00014 ,000 1,000

133 ,00025 1,00093 1,00065 ,000

108 1,00050 ,00094 1,00064 ,000

I,IIIII,IVV

Fathers social class 1980

noyes

Parent has psychotic dg 1972-2000

malefemale

Sex

schizophreniaother psych

Diagnosis

< 1 month> 1 month

Length of first hospitalization

Frequency (1) (2)Parameter coding

Page 33: Tilastomenetelmät psykiatrisessa epidemiologiassa

SPSS Output - tulokset

Variables in the Equation

1,048 ,375 7,805 1 ,005 2,852 1,367 5,948-,559 ,366 2,331 1 ,127 ,572 ,279 1,172-,047 ,043 1,199 1 ,274 ,954 ,876 1,038,839 ,385 4,740 1 ,029 2,314 1,087 4,926

,651 2 ,722,309 ,392 ,622 1 ,430 1,362 ,632 2,934,109 ,647 ,028 1 ,866 1,115 ,314 3,960,612 ,513 1,423 1 ,233 1,845 ,675 5,045,488 1,100 ,197 1 ,657 1,629

Length of 1st hospital.(1)Sex(1)

Onset ageDiagnosis(1)

Father’s Social Class 1980FSC 1980(1)FSC 1980(2)

Parental psychosis(1)Constant

B S.E. Wald df Sig. Exp(B) Lower Upper95,0% C.I.for EXP(B)

Page 34: Tilastomenetelmät psykiatrisessa epidemiologiassa

Varianssianalyysi Verrataan ryhmien sisäistä ja välistä variaatiota ANOVA

Yksi jatkuva selitettävä eli vastemuuttuja MANOVA

Useita jatkuvia vastemuuttujia Toistettujen mittausten ANOVA

= Repeated measurements ANOVA Samat mittaukset on tehty useaan kertaan

samoilta henkilöiltä ANOVA, MANOVA and rANOVA

Vain luokiteltuja altisteita ANCOVA, MANCOVA, rANCOVA

Myös jatkuvia altisteita

Page 35: Tilastomenetelmät psykiatrisessa epidemiologiassa

Esimerkki

Erot hippokampuksen koossa Pohjois-Suomen 1966 syntymäkohortti

Seurantatutkimus 1999-2001 Skitsofreniapotilaat (N=56) vs. terveet verrokit (N=104) Toistettujen mittausten ANCOVA

Oikean ja vasemman puolen hippokampusmittauksia käsitellään toistettuina mittauksia

Page 36: Tilastomenetelmät psykiatrisessa epidemiologiassa

Schizophrenia and Comparison subjectsHippocampus volumes

F Sig.

Model 1Within effect: side 20.3 < 0.001Diagnosis 1.2 0.28Gender 6.5 0.01Model 2Within effect: side 0.81 0.37Covariate: brain vol. 35.0 < 0.001Diagnosis < 0.01 0.89Gender 0.7 0.41Familial psychosis 1.9 0.17Perinatal risk 0.8 0.38Handedness 0.3 0.61

Tanskanen ym. Schizophrenia Research (2005)

Page 37: Tilastomenetelmät psykiatrisessa epidemiologiassa

Elinaika-analyysi

(Survival analysis)

Page 38: Tilastomenetelmät psykiatrisessa epidemiologiassa

Elinaika-analyysi

Tutkitaan aikaa kahden tapahtuman välissä, esim. Syntymästä sairastumiseen Sairastumisesta kuolemaan Uloskirjoittautumisesta uuteen sairaalahoitoon

Kaplan-Meierin mallilla arvioidaan tapahtumien todennäkoisyyksiä eri aikapisteissä

Käytössä usein kohorttitutkimuksissa

Page 39: Tilastomenetelmät psykiatrisessa epidemiologiassa

Elinaika-analyysiin tarvittava tieto

Tapahtuma (0,1) Aika tapahtumaan (päiviä, kuukausia,…)

tai sensurointiin Aineisto voi sensuroitua

Seuranta loppuu Menetetään yhteys tutkittavaan (esim.

muuttaa muualle) Seurattava henkilö kuolee muusta syystä

kuin mikä on tutkimuksen kohteena

Page 40: Tilastomenetelmät psykiatrisessa epidemiologiassa

EsimerkkiPohjois-Suomen 1966 Syntymäkohortti

Mikä ennustaa itsemurhan tekoikää? Otos Suomessa asuvat 16-vuotiaana (N=10,934) Seuranta vuoden 2001 loppuun

58 (0.5%) itsemurhaa 140 (1.3%) muuta kuolemaa 10,736 (98.2%) elossa

Ennustajamuuttuja Perhetyyppi syntymähetkellä (parisuhteessa, yksin)

Page 41: Tilastomenetelmät psykiatrisessa epidemiologiassa

log rank test, p=0.002Test Statistics for Equality of Survival Distributions

Survival Functions

age (years)

3530252015

Cum

Sur

viva

l

1,000

,999

,998

,997

,996

,995

,994

,993

,992

,991

,990

,989

family type 1966

full

full-censored

single

single-censored

Hazard Function

age (years)

3530252015C

um H

azar

d

,012

,010

,008

,006

,004

,002

0,000

family type 1966

full

full-censored

single

single-censored

Käyrät voivat kuvata eloonjäämistä (survival) tai toisinpäin piirrettynä vaaraa (hazard)

Page 42: Tilastomenetelmät psykiatrisessa epidemiologiassa

Ryhmien välisen eron, tai trendin erossa, tulisi olla suurinpiirtein sama seurannan ajan käyrien ei tulisi ainakaan mennä ristiin, jos

halutaan testata tilastollisesti Otoskoko voi olla suhteellisen pieni

Viitteitä, esim.Parmar & Machin: Survival analysis. A practical approach. John Wiley & Sons, 1995.

Page 43: Tilastomenetelmät psykiatrisessa epidemiologiassa

Sekoittavien tekijöiden huomiointiItsemurhan ikä ja perhetyyppi Mahdollisia sekoittavia tekijöitä

sukupuoli sosiaaliluokka 1966 (I-II,III-IV,V) kouluarvosanojen keskiarvo (14-v.) psykiatrinen diagnoosi (ei, kyllä) rikos (ei, ei-väkivaltainen, väkivaltainen)

Coxin regressioanalyysi

Page 44: Tilastomenetelmät psykiatrisessa epidemiologiassa

Categorical Variable Codings

5425 15222 0

10197 0450 1783 0 0

7823 1 02041 0 11975 18672 0

10019 0 0200 1 0428 0 1

1=male2=female

Sex

0=healthy1=any dg

Psych dg

1=I,II2=III,IV3=V

Fathers SocialClass 1966

1=single2=full

Family type1966

0=no crimes1=violent2=nonviolent

Criminality

Frequency (1) (2)

SPSS Output - muuttujat

Page 45: Tilastomenetelmät psykiatrisessa epidemiologiassa

Variables in the Equation

,812 ,340 5,720 1 ,017 2,253 1,158 4,3832,463 ,303 66,085 1 ,000 11,740 6,483 21,260

,728 ,287 6,429 1 ,011 2,072 1,180 3,6371,514 2 ,469

,451 ,715 ,398 1 ,528 1,570 ,386 6,377,536 ,436 1,513 1 ,219 1,710 ,727 4,018

-,276 ,164 2,825 1 ,093 ,759 ,550 1,0473,398 2 ,183

,239 ,454 ,276 1 ,600 1,269 ,521 3,093-1,011 ,625 2,613 1 ,106 ,364 ,107 1,239

SEXPSYCH DGFAM TYPEFSC 1966

FSC 1966(1)FSC 1966(2)

SCHOOL MARKCRIMES

CRIMES(1)CRIMES(2)

B SE Wald df Sig. Exp(B) Lower Upper95,0% CI for Exp(B)

SPSS Output - tulokset

Page 46: Tilastomenetelmät psykiatrisessa epidemiologiassa

Faktorianalyysi

Page 47: Tilastomenetelmät psykiatrisessa epidemiologiassa

Kyselylomakkeen kehittäminen Psykologia, psykiatria, hoitotiede,

kasvatustiede, sosiologia, … Lomakkeissa usein liki samoja asioita

mittaavia kysymyksiä Etsitään muuttujien yhdistelmistä

selittävää mallia, tiivistetään tietoa Etsitään tärkeimpiä muuttujia Kysymysten lukumäärä lomakkeessa

Mikä on sopiva (riittävä) määrä? Mahdolliset osa-asteikot

Page 48: Tilastomenetelmät psykiatrisessa epidemiologiassa

Piilevät muuttujat

Monia asioita ei voida mitata suoraan

Tarvitaan useita samaa ilmiötä mittaavia muuttujia

Esim. älykkyys, sosiaalisuus, konservatiivisuus

Page 49: Tilastomenetelmät psykiatrisessa epidemiologiassa

Faktorianalyysit Eksploratiivinen faktorianalyysi

(ja pääkomponenttianalyysi) [EFA (PCA)] vanhimpia monimuuttujamenetelmiä

(Spearman 1904) etsitään muuttujien kombinaatioista

selitettävää mallia Konfirmatorinen faktorianalyysi [CFA]

tutkitaan valmista mallia ja varmistetaan antaako aineisto tukea ko. mallille

Page 50: Tilastomenetelmät psykiatrisessa epidemiologiassa

Esimerkki Esimerkkinä on psykoosioireita

mittaavan PANSS (Positive and Negative Syndrome Scale)

-asteikon rakenne (30 muuttujaa) Mittarista on esitetty useita erilaisia

faktoriratkaisuja Aineistona on Pohjois-Suomen vuoden

1966 syntymäkohortin psykoottisia henkilöitä jotka osallistuivat haastatteluun 1999-2001 Pieni aineisto (N=85) Muuttujat likert-asteikolla (1-7) Muuttujissa on vaihtelua

Page 51: Tilastomenetelmät psykiatrisessa epidemiologiassa

Rotated Factor Matrixa

,943

,861

,833

,823 ,320

,763 ,361

,725

,691 ,362 ,416

,687 ,394

,542 ,523

,479 ,415 ,314

,447

,430 ,357

,845

,823

,407 ,785

,508

,371 ,493 ,304

,319

,739

,694

,688

,511 ,647

,537 ,411

,518

,463 ,474

,499

,457

,353

,330

Lack of spontaneity and flow of conversation (N6)

Stereotyped thinking (N7)

Blunted affect (N1)

Poor rapport (N3)

Passive/apathetic social withdrawal (N4)

Difficulty in abstract thinking (N5)

Emotional withdrawal (N2)

Motor retardation (G7)

Mannerisms and posturing (G5)

Poor attention (G11)

Tension (G4)

Disturbance of volition (G13)

Uncooperativeness (G8)

Disorientation (G10)

Preoccupation (G15)

Hostility (P7)

Active social avoidance (G16)

Suspiciousness/persecution (P6)

Unusual thought content (G9)

Lack of judgement and insight (G12)

Grandiosity (P5)

Conceptual disorganization (P2)

Delusions (P1)

Excitement (P4)

Poor impulse control (G14)

Depression (G6)

Guilt feelings (G3)

Hallucinatory behaviour (P3)

Somatic concern (G1)

Anxiety (G2)

1 2 3 4

Factor

Extraction Method: Principal Axis Factoring. Rotation Method: Varimax with Kaiser Normalization.

Rotation converged in 6 iterations.a.

- (taulukossa lataus, vain jos >0.3)

Page 52: Tilastomenetelmät psykiatrisessa epidemiologiassa

Muita menetelmiä

Structural Equation Modelling (Rakenneyhtälomallitus)

Latent Class Analysis

Page 53: Tilastomenetelmät psykiatrisessa epidemiologiassa

Rakenneyhtälömallitus

Faktorianalyysin ja regressioanalyysin yhdistelmä

Jatkuvia ja luokiteltuja altisteita ja vasteita Esitetään mitattujen muuttujien ja piilevien

muuttujien suhteet (esim. korrelaatioina)

Byrne (2001) Structural Equation Modeling with AMOS: Basic Concepts, Applications, and Programming.

Page 54: Tilastomenetelmät psykiatrisessa epidemiologiassa

Esimerkki: Mistä hyvinvointi koostuu?

McGartland Rubio ym. 2001

Page 55: Tilastomenetelmät psykiatrisessa epidemiologiassa

Latent class analysis

Kehitetty ryhmittelemään henkilöt valittujen piirteiden mukaan Luokittelee ihmiset ryhmiin Kertoo piirteet (säännöt) joilla luokitus tehtiin

Verrattavissa klusterianalyysiin Klusterianalyysi ei anna sääntöjä luokitukseen

(=mallia)

Muthén & Muthén (Alcohol Clin Exp Res, 24, 882-91, 2000)

Page 56: Tilastomenetelmät psykiatrisessa epidemiologiassa

Esimerkki: Antisosiaalinen käyttäytyminen

Damaged property Fighting Shoplifting Stole <$50 Stole >$50 Use of force Seriously threaten Intent to injure

Use Marijuana Use other drug Sold Marijuana Sold hard drugs ‘Con’ somebody Stole an Automobile Broken into a building Held stolen goods Gambling Operation

National Longitudinal Survey of Youth (NLSY) Respondent ages between 16 and 23 Background information: age, gender and ethnicity N=7,326

17 antisocial dichotomously scored behavior items:

Lähde:http://www.ats.ucla.edu/stat/mplus/seminars/lca/default.htm

Page 57: Tilastomenetelmät psykiatrisessa epidemiologiassa

Damage Property Fighting Shoplifting Stole <$50 Gambling. . .

Male

Race

Age

C

Esimerkki: Antisosiaalinen käyttäytyminen

Page 58: Tilastomenetelmät psykiatrisessa epidemiologiassa

Esimerkki: Antisosiaalinen käyttäytyminen

Page 59: Tilastomenetelmät psykiatrisessa epidemiologiassa

Relationship between class probabilities and age by gender

Females Males

16 17 18 19 20 21 22 23 (age) 16 17 18 19 20 21 22 23

Page 60: Tilastomenetelmät psykiatrisessa epidemiologiassa

Luotettavuuden arviointi

Page 61: Tilastomenetelmät psykiatrisessa epidemiologiassa

Reliabiliteetti Kuinka hyvin mittarilla tehty mittaus on

toistettavissa (=stabiliteetti) kuinka yhdenmukaisesti kaksi

mittaria/mittaajaa arvioi samaa asiaa tai kuinka hyvin mittarin kysymykset mittaa samaa asiaa (=konsistenssi)

Validiteetti Kuinka hyvin mittari mittaa sitä mitä sen

pitäisi mitata

Reliabiliteetin ja validiteetin käsitteitä

Psykiatriassa reliabiliteetti ja validiteetti on usein vaikeampi saavuttaa kuin somaattisella puolella!

Page 62: Tilastomenetelmät psykiatrisessa epidemiologiassa

•Reliabiliteetti hyvä•Validiteetti huono

•Reliabiliteetti huono•Validiteetti huono

•Reliabiliteetti hyvä•Validiteetti hyvä

•Validiteetti ei voi olla hyvä, jos reliabiliteetti on huono

Page 63: Tilastomenetelmät psykiatrisessa epidemiologiassa

Construct validity (=rakennevaliditeetti) onko teoriakäsite riittävästi ja onnistuneesti

mitattu? Convergent validity (=yhtenevyys)

onnistuuko käsitteen mittaaminen muulla mittarilla

Discriminant validity (=erottelu) onnistuuko mittari erottamaan käsitteen muista

käsitteistä

Reliabiliteetin ja validiteetin käsitteitä

Blacker & Endicott 2000, Morgan et al. 2001

Page 64: Tilastomenetelmät psykiatrisessa epidemiologiassa

Content validity (=sisältövaliditeetti) Kattavatko kysymykset käsitteen riittävästi

Face validity (=näennäisvaliditeetti) Vaikuttaako mittari mittaavan sitä mitä on

tarkoitus

Reliabiliteetin ja validiteetin käsitteitä

Blacker & Endicott 2000, Morgan et al. 2001

Page 65: Tilastomenetelmät psykiatrisessa epidemiologiassa

Criterion validity (=kriteerivaliditeetti) Miten mittari liittyy muihin samaa asiaa mittaaviin

kriteereihin, esimerkiksi diagnoosiin Concurrent validity (=samanaikaisvaliditeetti)

Kuinka hyvin mittari ennustaa henkilön nykyistä tilaa

Predictive validity (=ennustevaliditeetti) Kuinka hyvin mittari ennustaa henkilön tulevaa tilaa

Reliabiliteetin ja validiteetin käsitteitä

Blacker & Endicott 2000, Morgan et al. 2001

Page 66: Tilastomenetelmät psykiatrisessa epidemiologiassa

Luotettavuuden testaaminen

Luokiteltu muuttuja Kappa, yhdenmukaisuus

Jatkuva muuttuja Intraclass korrelaatio (arvioiden tai

mittausten yhdenmukaisuus) Cronbachin Alpha

(kysymyslomakkeen sisäinen yhdenmukaisuus)

Voidaan testata joko arvioijien välillä (interrater) tai saman arvioijan kahden eri arvion välillä (test-retest)

Page 67: Tilastomenetelmät psykiatrisessa epidemiologiassa

Diagnostiseen testiin liittyviä käsitteitä Positiivisen tuloksen ennustearvo (positive predictive

value, PPV) Testillä oikein sairaaksi todettujen osuus kaikista

testipositiivisista Negatiivisen tuloksen ennustearvo (negative

predictive value, NPV) Testillä oikein terveiksi todettujen osuus kaikista

testinegatiivisista Herkkyys (sensitivity, se)

Testillä oikein tautia sairastaviksi todettujen osuus kaikista kyseistä tautia sairastavista

Tarkkuus (specificity, sp) Testillä oikein terveiksi todettujen osuus kaikista

kyseistä terveistä

Uhari. Duodecim 2004; 120: 935-41.

Page 68: Tilastomenetelmät psykiatrisessa epidemiologiassa

Arvioija B

Arvioija A Kyllä Ei Yhteensä

Kyllä a b g1

Ei c d g2

Yhteensä f1 f2 N

Reliabiliteetti

Havaittu yksimielisyys po = (a+d) / N

Sattuman mukaan odotettu yksimielisyys pe = (f1g1+f2g2) / N2

Kappa = (po-pe) / (1-pe)

Validiteetti (Arvioija B on oikeassa eli “kultainen standardi”, Arvioijan A validiteettia arvioijaan)

Sensitiivisyys Se = a / f1

Spesivisyys Sp = d / f2Positiivinen ennustearvo PPV = a / g1

Negatiivinen ennustearvo NPV = d / g2

Page 69: Tilastomenetelmät psykiatrisessa epidemiologiassa

Arvioija B

Arvioija A Kyllä Ei Yhteensä

Kyllä 35 15 50

Ei 25 125 150

Yhteensä 60 140 200

Reliabiliteetti

Havaittu yksimielisyys po = (35+125) / 200 = 0.80 (80%)Sattuman mukaan odotettu yksimielisyys pe = (50*60+140*150) / 2002 = 0.60 (60%)Kappa = (0.8-0.6) / (1-0.6) = 0.50

Validiteetti (Arvioija B on oikeassa eli “kultainen standardi”, Arvioijan A validiteettia arvioijaan)

Sensitiivisyys Se = 35 / 60 = 0.58 (58%)Spesivisyys Sp = 125 / 140 = 0.89 (89%)Positiivinen testituloksen ennustearvo PPV = 35 / 50 = 0.70 (70%)Negatiivinen testituloksen ennustearvo NPV = 125 / 150 = 0.83 (83%)

Page 70: Tilastomenetelmät psykiatrisessa epidemiologiassa

ROC -käyräReceiver Operating Characteristic (ROC)

Sens

itivi

ty

1 - Specificity

Page 71: Tilastomenetelmät psykiatrisessa epidemiologiassa

Cronbachin alpha

Perustuu varianssianalyysiin Kertoo kuinka yhdenmukaisesti mittarin eri

kysymykset mittaavat samaa asiaa (internal consistency)

Voidaan tehdä koko mittarille ja erikseen jokaiselle osa-asteikolle

Page 72: Tilastomenetelmät psykiatrisessa epidemiologiassa

DATA ESIMERKKI

VAR1 VAR2 VAR3 VAR4 VAR5...

CASE1 0 1 1 2 0 …CASE2 4 5 4 3 3 …CASE3 0 0 1 0 0 …CASE4 2 2 2 2 3 …CASE5 3 1 1 2 3 … . :

Page 73: Tilastomenetelmät psykiatrisessa epidemiologiassa

On esitetty erilaisia raja-arvoja, sille mikä on riittävä alpha

0.60 – 0.80, esim. 0.70 (Nunnally 1978) Alphan suuruuteen vaikuttaa kysymysten

lukumäärä, mitä enemmän sitä suurempi alpha

Muuttujien vinous ongelma, samoin jos sama vastaaja vastaa kaikkiin kysymyksiin samoin (=varianssi on tärkeä)

Cronbachin alpha

Nunnally (1978) Psychometric Theory

Page 74: Tilastomenetelmät psykiatrisessa epidemiologiassa

Esimerkkiaineisto

Pohjois-Suomen vuoden 1966 syntymäkohortin 31-vuotisseuranta

TCI (Temperament and Character Inventory) Reward Dependence –alaskaala

RD1 – Sentimentality RD3 – Attachment RD4 – Dependence

Kaksiluokkaisia muuttujia

Page 75: Tilastomenetelmät psykiatrisessa epidemiologiassa

Reliability Statistics

,689 24

Cronbach'sAlpha N of Items

Reliability Statistics

,610 10

Cronbach'sAlpha N of Items

Reliability Statistics

,706 8

Cronbach'sAlpha N of Items

Reliability Statistics

,490 6

Cronbach'sAlpha N of Items

RD – koko asteikko

RD – 4 Dependence

RD – 1 Sentimentality

RD 3 – Attachment

Page 76: Tilastomenetelmät psykiatrisessa epidemiologiassa

Tilasto-ohjelmia

SPSS (www.spss.com) SAS (www.sas.com) STATA (www.stata.com) R+ (cran.r-project.org) SUDAAN (www.rti.org/sudaan) Mplus (www.statmodel.com) StatsDirect (www.camcode.com) MetaWin (www.metawinsoft.com)

Page 77: Tilastomenetelmät psykiatrisessa epidemiologiassa

Käsitteitä Incidence Rate Ratio / Case Fatality Rate Ratio

Kahden ilmaantuvuuden / tapauskuoleisuuden suhde Stanzardized Mortality Ratio

Havaitut kuolemat / odotetut kuolemat Lisäriski (Attributable Risk, AR)

Riskimuuttujan omaavien henkilöiden lisäriski sairauteen Väestön lisäriski (Population Attributable Risk, PAR)

Sairaiden osuus väestössä mikä johtuu riskimuuttujasta Attributable Risk Reduction, ARR

Riskin väheneminen joka saadaan esim. Tutkittavalla hoidolla tai kun riskimuuttujan vaikutus poistettaisiin

Number Needed to Treat, NNT Kuinka paljon pitäisi potilaita pitäisi hoitaa jotta vältyttäisiin

yhdeltä vastetapahtumalta (esim. kuolema) NNT = 1 / ARR

http://www.vetmed.wsu.edu/courses-jmgay/GlossClinEpiEBM.htm

Page 78: Tilastomenetelmät psykiatrisessa epidemiologiassa

Yleisiä lähteitä tilastomenetelmiin suomeksi

Metsämuuronen. Tutkimuksen tekemisen perusteet ihmistieteissä (2003).

Nummenmaa ym. Tutkimusaineiston analyysi (1997).

Uhari. Biostatistiikan taskutieto (2002). Uhari & Nieminen. Epidemiologia & Biostatistiikka

(2001).

SPSS, SAS, jne. Oppaat