Tilastomenetelmät psykiatrisessa epidemiologiassa
description
Transcript of Tilastomenetelmät psykiatrisessa epidemiologiassa
Tilastomenetelmät psykiatrisessa epidemiologiassa
Jouko Miettunen, FT
9.10.2007 Psykiatrian klinikka
Esitelmän aiheetPerusmenetelmiä Ristiintaulukkojen testaaminen Jakaumien tunnusluvut ja testaaminen KorrelaatiokertoimetMonimuuttujamenetelmiä Regressioanalyysit Elinaika-analyysi Varianssianalyysit Faktorianalyysit Muita menetelmiä(Luotettavuuden arviointi)Tilasto-ohjelmatKirjallisuutta
Perusmenetelmiä
Luokitellut muuttujat Jakaumien vertailu ryhmien välillä Tilastollinen testaaminen
Khiin neliötesti, OR, RR
Jatkuvat muuttujat Keskiarvojen vertailu ryhmien välillä
Studentin t-testi Mediaanien vertailu ryhmien välillä
Mann-Whitneyn U-testi Kruskal-Wallisin testi
Korrelaatiokertoimet
Jatkuva vai luokiteltu muuttuja?
Luokittelemalla menetetään tietoa Usein kuitenkin selkeyttää tulosten
esittämistä Analyysimenetelmät erilaisia
Luokittelutapoja
Aiemmat tutkimukset Kliiniset kriteerit Aineistoon perustuvat
Mediaani, kvartiilit, alin/ylin 10%, jne. Keskiarvo Keskiarvo ± 2 keskihajontaa
Ristiintaulukkojen testaaminen
2 –testi Fisherin tarkka testi (Fisher’s exact test)
Epidemiologiassa erityisesti käytössä vetosuhde, ristitulosuhde (odds ratio) riskisuhde (risk ratio)
Pohjois-Suomen 1966 syntymäkohortti Seisomaan oppiminen ja myöhempi
psykoottinen sairaus Jatkoanalyysi psykoosipotilaiden joukossa
Onko sukurasituksella merkitystä?
Esimerkki
2 –testi
Chi-Square Tests
12,802a 2 ,002
12,658 2 ,002
12,759 1 ,000
9609
Pearson Chi-Square
Likelihood Ratio
Linear-by-LinearAssociation
N of Valid Cases
Value dfAsymp. Sig.
(2-sided)
0 cells (,0%) have expected count less than 5. Theminimum expected count is 34,63.
a.
Age at standing unsupported * Psychotic disorder until 2001
4074 40 4114
99,0% 1,0% 100,0%
2430 35 2465
98,6% 1,4% 100,0%
2970 60 3030
98,0% 2,0% 100,0%
9474 135 9609
98,6% 1,4% 100,0%
Count
Count
Count
Count
- 10 months
11 months
12 months +
Age at standingunsupported
Total
healthy any psychosis
Psychotic disorder until2001
Total
Fisherin tarkkatesti
Chi-Square Tests
,951a 2 ,622 ,620
,969 2 ,616 ,620
,800 ,793
,752b
1 ,386 ,476 ,274 ,142
56
Pearson Chi-Square
Likelihood Ratio
Fisher's Exact Test
Linear-by-LinearAssociation
N of Valid Cases
Value dfAsymp. Sig.
(2-sided)Exact Sig.(2-sided)
Exact Sig.(1-sided)
PointProbability
3 cells (50,0%) have expected count less than 5. The minimum expected count is 1,45.a.
The standardized statistic is ,867.b.
- Pienille otoksille- Jos väh. 25 prosentissa soluista odotettu arvo on alle 5
Age at standing unsupported * Any psychotic 1st degree relative
8 1 9
88,9% 11,1% 100,0%
16 2 18
88,9% 11,1% 100,0%
23 6 29
79,3% 20,7% 100,0%
47 9 56
83,9% 16,1% 100,0%
Count
Count
Count
Count
- 10 months
11 months
12 months +
Age at standingunsupported
Total
no yes
Any psychotic 1stdegree relative
Total
Assosiaation mittaaminen epidemiologiassa
Absoluuttinen Riskiero (risk difference)
Altistunut – ei-altistunut Suhteellinen
Riskisuhde (risk ratio, relative risk, RR) Ristitulosuhde tai vetosuhde (odds ratio, OR)
Altistunut / ei-altistunut Eivät kerro sellaisenaan kausaliteetista
a / (a + b)c / (c + d)=Riskisuhde, RR
Tauti
Altiste Kyllä Ei Yhteensä
Kyllä a b a + b
Ei c d c + d
Yhteensä a + c b + c a + b + c + d
a / bc / d=Odds Ratio, OR ad
bc=
24 / (24 + 459)132 / (132 + 10319)=RR
Lapsella psykoosi
Vanhemmalla psykoosi Kyllä Ei Yhteensä
Kyllä 24 (5.0%) 459 483
Ei 132 (1.3%) 10319 10451
Yhteensä 156 10451 10934
24 / 459132 / 10319=OR = 4.1
= 3.9
Odds Ratio (OR) vai Risk Ratio (RR)?
RR tarkempi riskin tunnuslukuna Mikäli yleinen sairaus tulisi käyttää RR:ää OR:ssä on helpompi ottaa huomioon
sekoittavat tekijät Mikäli harvinainen sairaus ja iso aineisto
OR ≈ RR
Jatkuvat muuttujat
Keskiarvo vai mediaani?
Keskiarvo soveltuu likimain normaalijakautuneelle aineistolle
Mikäli aineistossa on paljon poikkeavia arvoja tai se on huomattavan vino, mediaani kuvaa muuttujan jakaumaa paremmin
Normaaliuden arviointi Mikäli mediaani ja keskiarvo eroavat
huomattavasti toisistaan, jakauma ei ole normaalijakautunut
Huipukkuus (kurtosis) ja vinous (skewness) kuvaavat normaalisuutta
Normaaliuden testit eivät ole tehokkaita Kolmogorov-Smirnov testi Shapiro-Wilk testi (kun N<50)
Tärkein on kuitenkin visuaalinen arvio!
Muuttujien erilaisia jakaumia
Havainnot on kasaantunut oikealle (jakauma on negatiivisesti vino eli vino vasemmalle)
B on normaalijakautunut. A on positiivisesti huipukas jakaumaC negatiivisesti huipukas jakauma
Independent Samples Testa
16,149 ,000 2,530 5307 ,011 ,76781 ,30348 ,17286 1,36275
1,518 62,521 ,134 ,76781 ,50596 -,24343 1,77904
8,457 ,004 ,693 5339 ,488 44,80588 64,64790 -81,93042 171,54218
,476 63,708 ,636 44,80588 94,18373 -143,364 232,97614
Equal variancesassumed
Equal variancesnot assumed
Equal variancesassumed
Equal variancesnot assumed
height at birth
weight at birth
F Sig.
Levene's Test forEquality of Variances
t df Sig. (2-tailed)Mean
DifferenceStd. ErrorDifference Lower Upper
95% ConfidenceInterval of the
Difference
t-test for Equality of Means
sex = femalea.
Keskiarvojen vertailu: t-testiGroup Statisticsa
5246 49,8313 2,36884 ,03271
63 49,0635 4,00755 ,50490
5277 3421,6809 510,57590 7,02857
64 3376,8750 751,36886 93,92111
Functional psychosis;validated diagnosis -97(notes until 31.12.1997)no
yes
no
yes
height at birth
weight at birth
N Mean Std. DeviationStd. Error
Mean
sex = femalea.
Test Statisticsa
5126257
1E+007
-6,091
,000
Mann-Whitney U
Wilcoxon W
Z
Asymp. Sig. (2-tailed)
tassum
Grouping Variable: sexa.
Mediaanien vertailu: Mann-Whitneyn U-testi
Case Summaries
tassum
3293 49,0000 48,4376
3406 47,0000 47,3165
6699 48,0000 47,8676
sexboy
girl
Total
N Median Mean
Pohjois-Suomen 1986 syntymäkohortti 15-16 v.: Toronto Alexithymia Scale
Ranks
3293 3496,29 11513272,50
3406 3208,57 10928377,50
6699
sexboy
girl
Total
tassumN Mean Rank Sum of Ranks
Test Statisticsa,b
101,779
2
,000
Chi-Square
df
Asymp. Sig.
SCLDepression
mean
Kruskal Wallis Testa.
Grouping Variable: Educational level 1997b.
Mediaanien vertailu: Kruskal-Wallisin H-testiPohjois-Suomen 1966 syntymäkohortti: masennusoireet (SCL-25)
Ranks
857 4576,54
5072 4192,02
2273 3720,40
8202
Educational level1997 (register)Basic (<=9 yrs)
Secondary (10-12 yrs)
Tertiary (over 12 yrs)
Total
SCL Depression meanN Mean Rank
- Ei testaa varsinaisesti mediaaneja vaan koko jakauman sijaintia (suositeltavaa)- Varsinaisesti mediaaneja testataan esim. jakamalla koko aineisto mediaanista kahteen osaan ja verrataan jakaumia ryhmien välillä (esim. tässä koulutuksen mukaan) –testillä.
Korrelaatiokertoimet
Pearsonin korrelaatiokerroin Normaalijakautuneille muuttujille
Spearmanin korrelaatiokerroin Ei-normaalijakautuneille muuttujille Järjestyskorrelaatiokerroin (mean rank)
Tuloksia voi graafisesti esittää korrelaatiodiagrammin avulla
Korrelaatiodiagrammi
r = 0.75
Monimuuttujamenetelmät
Lineaarinen regressioanalyysi Selitetään jatkuvaa (tai ainakin välimatka-
asteikollista) muuttujaa Selittäviä muuttujia voi olla useita
Jatkuvia tai kaksiluokkaisia muuttujia Muuttujien välinen riippuvuus oletetaan
lineaariseksi Selittävät muuttujat ei saa liikaa korreloida
keskenään (multikollineaarisuus) Selitettävän muuttujan hajonta ei riipu
selittävien muuttujien hajonnasta (homoskedastisuus)
Kohortti 1966, 31 v. seuranta Alkoholin käytön (g/pv) ennustaminen Ennustavat muuttujat
Sukupuoli Siviilisääty (naimaton tai eronnut, ei/kyllä) Masennus
Jatkuva muuttuja (SCL-masennusoireet) Syntymäpaino
Jatkuva muuttuja (g)
Esimerkki
Coefficientsa
1,454 ,046 31,564 ,00000 1,364 1,544
-,302 ,011 -,295 -27,146 ,00000 -,324 -,280
,153 ,015 ,110 10,138 ,00000 ,123 ,182
,118 ,027 ,047 4,344 ,00001 ,065 ,171
,000 ,000 ,007 ,641 ,52133 ,000 ,000
(Constant)
sex
SCL Depression mean
divorced or widow at31yr study
weight at birth
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig. Lower Bound Upper Bound
95% Confidence Interval for B
Dependent Variable: Current use of alcohol (g/day) 31va.
EsimerkkiModel Summary
,306a ,094 ,093 ,48615Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), divorced or widow at 31yr study,sex, SCL Depression mean
a.
Logistinen regressioanalyysi Yleisin tapa ottaa huomioon sekoittavat
muuttujat, Erityisesti pitkittäistutkimuksissa Vastemuuttuja (outcome) on kaksiluokkainen
(esim. kyllä/ei) Altistemuuttujat (exposure) voivat olla sekä
kaksiluokkaisia, useampiluokkaisia että jatkuvia Multinomiaalisessa logistisessa
regressioanalyysissa vastemuuttujassa voi olla useita luokkia
Muuttujien valinta, esim. Aiemman tiedon tai ko. aineiston perusteella Sosiodemograafiset muuttujat, esim. sukupuoli,
sosiaaliluokka? Malliin mukaan aiemmin tunnetut sekoittavat
tekijät? Erityisesti jos vaikuttavat tuloksiin
Mukana ei saa olla liikaa muuttujia Riippuu aineiston koosta ja muuttujien jakaumista
Mukana ei kannata olla keskenään liikaa korreloivia muuttujia
Esimerkki
Pohjois-Suomen vuoden 1966 syntymäkohortti
N = 10 934 Runsaasti haastattelu- ja
rekisteridataa
Esimerkki
Mikä psykoottisilla potilailla ennustaa uutta sairaalahoitoa?
N = 158 Altistemuuttujat
sukupuoli Isän sosiaaliluokka (1980) Sukurasitus Sairastumisikä Ensimmäisen sairaalahoidon kesto diagnoosi (skitsofrenia / muu psykoosi)
Miettunen ym. Nord J Psychiatry 2006; 60: 286-93.
SPSS Output - muuttujat
Categorical Variables Codings
48 ,000 ,00096 1,000 ,00014 ,000 1,000
133 ,00025 1,00093 1,00065 ,000
108 1,00050 ,00094 1,00064 ,000
I,IIIII,IVV
Fathers social class 1980
noyes
Parent has psychotic dg 1972-2000
malefemale
Sex
schizophreniaother psych
Diagnosis
< 1 month> 1 month
Length of first hospitalization
Frequency (1) (2)Parameter coding
SPSS Output - tulokset
Variables in the Equation
1,048 ,375 7,805 1 ,005 2,852 1,367 5,948-,559 ,366 2,331 1 ,127 ,572 ,279 1,172-,047 ,043 1,199 1 ,274 ,954 ,876 1,038,839 ,385 4,740 1 ,029 2,314 1,087 4,926
,651 2 ,722,309 ,392 ,622 1 ,430 1,362 ,632 2,934,109 ,647 ,028 1 ,866 1,115 ,314 3,960,612 ,513 1,423 1 ,233 1,845 ,675 5,045,488 1,100 ,197 1 ,657 1,629
Length of 1st hospital.(1)Sex(1)
Onset ageDiagnosis(1)
Father’s Social Class 1980FSC 1980(1)FSC 1980(2)
Parental psychosis(1)Constant
B S.E. Wald df Sig. Exp(B) Lower Upper95,0% C.I.for EXP(B)
Varianssianalyysi Verrataan ryhmien sisäistä ja välistä variaatiota ANOVA
Yksi jatkuva selitettävä eli vastemuuttuja MANOVA
Useita jatkuvia vastemuuttujia Toistettujen mittausten ANOVA
= Repeated measurements ANOVA Samat mittaukset on tehty useaan kertaan
samoilta henkilöiltä ANOVA, MANOVA and rANOVA
Vain luokiteltuja altisteita ANCOVA, MANCOVA, rANCOVA
Myös jatkuvia altisteita
Esimerkki
Erot hippokampuksen koossa Pohjois-Suomen 1966 syntymäkohortti
Seurantatutkimus 1999-2001 Skitsofreniapotilaat (N=56) vs. terveet verrokit (N=104) Toistettujen mittausten ANCOVA
Oikean ja vasemman puolen hippokampusmittauksia käsitellään toistettuina mittauksia
Schizophrenia and Comparison subjectsHippocampus volumes
F Sig.
Model 1Within effect: side 20.3 < 0.001Diagnosis 1.2 0.28Gender 6.5 0.01Model 2Within effect: side 0.81 0.37Covariate: brain vol. 35.0 < 0.001Diagnosis < 0.01 0.89Gender 0.7 0.41Familial psychosis 1.9 0.17Perinatal risk 0.8 0.38Handedness 0.3 0.61
Tanskanen ym. Schizophrenia Research (2005)
Elinaika-analyysi
(Survival analysis)
Elinaika-analyysi
Tutkitaan aikaa kahden tapahtuman välissä, esim. Syntymästä sairastumiseen Sairastumisesta kuolemaan Uloskirjoittautumisesta uuteen sairaalahoitoon
Kaplan-Meierin mallilla arvioidaan tapahtumien todennäkoisyyksiä eri aikapisteissä
Käytössä usein kohorttitutkimuksissa
Elinaika-analyysiin tarvittava tieto
Tapahtuma (0,1) Aika tapahtumaan (päiviä, kuukausia,…)
tai sensurointiin Aineisto voi sensuroitua
Seuranta loppuu Menetetään yhteys tutkittavaan (esim.
muuttaa muualle) Seurattava henkilö kuolee muusta syystä
kuin mikä on tutkimuksen kohteena
EsimerkkiPohjois-Suomen 1966 Syntymäkohortti
Mikä ennustaa itsemurhan tekoikää? Otos Suomessa asuvat 16-vuotiaana (N=10,934) Seuranta vuoden 2001 loppuun
58 (0.5%) itsemurhaa 140 (1.3%) muuta kuolemaa 10,736 (98.2%) elossa
Ennustajamuuttuja Perhetyyppi syntymähetkellä (parisuhteessa, yksin)
log rank test, p=0.002Test Statistics for Equality of Survival Distributions
Survival Functions
age (years)
3530252015
Cum
Sur
viva
l
1,000
,999
,998
,997
,996
,995
,994
,993
,992
,991
,990
,989
family type 1966
full
full-censored
single
single-censored
Hazard Function
age (years)
3530252015C
um H
azar
d
,012
,010
,008
,006
,004
,002
0,000
family type 1966
full
full-censored
single
single-censored
Käyrät voivat kuvata eloonjäämistä (survival) tai toisinpäin piirrettynä vaaraa (hazard)
Ryhmien välisen eron, tai trendin erossa, tulisi olla suurinpiirtein sama seurannan ajan käyrien ei tulisi ainakaan mennä ristiin, jos
halutaan testata tilastollisesti Otoskoko voi olla suhteellisen pieni
Viitteitä, esim.Parmar & Machin: Survival analysis. A practical approach. John Wiley & Sons, 1995.
Sekoittavien tekijöiden huomiointiItsemurhan ikä ja perhetyyppi Mahdollisia sekoittavia tekijöitä
sukupuoli sosiaaliluokka 1966 (I-II,III-IV,V) kouluarvosanojen keskiarvo (14-v.) psykiatrinen diagnoosi (ei, kyllä) rikos (ei, ei-väkivaltainen, väkivaltainen)
Coxin regressioanalyysi
Categorical Variable Codings
5425 15222 0
10197 0450 1783 0 0
7823 1 02041 0 11975 18672 0
10019 0 0200 1 0428 0 1
1=male2=female
Sex
0=healthy1=any dg
Psych dg
1=I,II2=III,IV3=V
Fathers SocialClass 1966
1=single2=full
Family type1966
0=no crimes1=violent2=nonviolent
Criminality
Frequency (1) (2)
SPSS Output - muuttujat
Variables in the Equation
,812 ,340 5,720 1 ,017 2,253 1,158 4,3832,463 ,303 66,085 1 ,000 11,740 6,483 21,260
,728 ,287 6,429 1 ,011 2,072 1,180 3,6371,514 2 ,469
,451 ,715 ,398 1 ,528 1,570 ,386 6,377,536 ,436 1,513 1 ,219 1,710 ,727 4,018
-,276 ,164 2,825 1 ,093 ,759 ,550 1,0473,398 2 ,183
,239 ,454 ,276 1 ,600 1,269 ,521 3,093-1,011 ,625 2,613 1 ,106 ,364 ,107 1,239
SEXPSYCH DGFAM TYPEFSC 1966
FSC 1966(1)FSC 1966(2)
SCHOOL MARKCRIMES
CRIMES(1)CRIMES(2)
B SE Wald df Sig. Exp(B) Lower Upper95,0% CI for Exp(B)
SPSS Output - tulokset
Faktorianalyysi
Kyselylomakkeen kehittäminen Psykologia, psykiatria, hoitotiede,
kasvatustiede, sosiologia, … Lomakkeissa usein liki samoja asioita
mittaavia kysymyksiä Etsitään muuttujien yhdistelmistä
selittävää mallia, tiivistetään tietoa Etsitään tärkeimpiä muuttujia Kysymysten lukumäärä lomakkeessa
Mikä on sopiva (riittävä) määrä? Mahdolliset osa-asteikot
Piilevät muuttujat
Monia asioita ei voida mitata suoraan
Tarvitaan useita samaa ilmiötä mittaavia muuttujia
Esim. älykkyys, sosiaalisuus, konservatiivisuus
Faktorianalyysit Eksploratiivinen faktorianalyysi
(ja pääkomponenttianalyysi) [EFA (PCA)] vanhimpia monimuuttujamenetelmiä
(Spearman 1904) etsitään muuttujien kombinaatioista
selitettävää mallia Konfirmatorinen faktorianalyysi [CFA]
tutkitaan valmista mallia ja varmistetaan antaako aineisto tukea ko. mallille
Esimerkki Esimerkkinä on psykoosioireita
mittaavan PANSS (Positive and Negative Syndrome Scale)
-asteikon rakenne (30 muuttujaa) Mittarista on esitetty useita erilaisia
faktoriratkaisuja Aineistona on Pohjois-Suomen vuoden
1966 syntymäkohortin psykoottisia henkilöitä jotka osallistuivat haastatteluun 1999-2001 Pieni aineisto (N=85) Muuttujat likert-asteikolla (1-7) Muuttujissa on vaihtelua
Rotated Factor Matrixa
,943
,861
,833
,823 ,320
,763 ,361
,725
,691 ,362 ,416
,687 ,394
,542 ,523
,479 ,415 ,314
,447
,430 ,357
,845
,823
,407 ,785
,508
,371 ,493 ,304
,319
,739
,694
,688
,511 ,647
,537 ,411
,518
,463 ,474
,499
,457
,353
,330
Lack of spontaneity and flow of conversation (N6)
Stereotyped thinking (N7)
Blunted affect (N1)
Poor rapport (N3)
Passive/apathetic social withdrawal (N4)
Difficulty in abstract thinking (N5)
Emotional withdrawal (N2)
Motor retardation (G7)
Mannerisms and posturing (G5)
Poor attention (G11)
Tension (G4)
Disturbance of volition (G13)
Uncooperativeness (G8)
Disorientation (G10)
Preoccupation (G15)
Hostility (P7)
Active social avoidance (G16)
Suspiciousness/persecution (P6)
Unusual thought content (G9)
Lack of judgement and insight (G12)
Grandiosity (P5)
Conceptual disorganization (P2)
Delusions (P1)
Excitement (P4)
Poor impulse control (G14)
Depression (G6)
Guilt feelings (G3)
Hallucinatory behaviour (P3)
Somatic concern (G1)
Anxiety (G2)
1 2 3 4
Factor
Extraction Method: Principal Axis Factoring. Rotation Method: Varimax with Kaiser Normalization.
Rotation converged in 6 iterations.a.
- (taulukossa lataus, vain jos >0.3)
Muita menetelmiä
Structural Equation Modelling (Rakenneyhtälomallitus)
Latent Class Analysis
Rakenneyhtälömallitus
Faktorianalyysin ja regressioanalyysin yhdistelmä
Jatkuvia ja luokiteltuja altisteita ja vasteita Esitetään mitattujen muuttujien ja piilevien
muuttujien suhteet (esim. korrelaatioina)
Byrne (2001) Structural Equation Modeling with AMOS: Basic Concepts, Applications, and Programming.
Esimerkki: Mistä hyvinvointi koostuu?
McGartland Rubio ym. 2001
Latent class analysis
Kehitetty ryhmittelemään henkilöt valittujen piirteiden mukaan Luokittelee ihmiset ryhmiin Kertoo piirteet (säännöt) joilla luokitus tehtiin
Verrattavissa klusterianalyysiin Klusterianalyysi ei anna sääntöjä luokitukseen
(=mallia)
Muthén & Muthén (Alcohol Clin Exp Res, 24, 882-91, 2000)
Esimerkki: Antisosiaalinen käyttäytyminen
Damaged property Fighting Shoplifting Stole <$50 Stole >$50 Use of force Seriously threaten Intent to injure
Use Marijuana Use other drug Sold Marijuana Sold hard drugs ‘Con’ somebody Stole an Automobile Broken into a building Held stolen goods Gambling Operation
National Longitudinal Survey of Youth (NLSY) Respondent ages between 16 and 23 Background information: age, gender and ethnicity N=7,326
17 antisocial dichotomously scored behavior items:
Lähde:http://www.ats.ucla.edu/stat/mplus/seminars/lca/default.htm
Damage Property Fighting Shoplifting Stole <$50 Gambling. . .
Male
Race
Age
C
Esimerkki: Antisosiaalinen käyttäytyminen
Esimerkki: Antisosiaalinen käyttäytyminen
Relationship between class probabilities and age by gender
Females Males
16 17 18 19 20 21 22 23 (age) 16 17 18 19 20 21 22 23
Luotettavuuden arviointi
Reliabiliteetti Kuinka hyvin mittarilla tehty mittaus on
toistettavissa (=stabiliteetti) kuinka yhdenmukaisesti kaksi
mittaria/mittaajaa arvioi samaa asiaa tai kuinka hyvin mittarin kysymykset mittaa samaa asiaa (=konsistenssi)
Validiteetti Kuinka hyvin mittari mittaa sitä mitä sen
pitäisi mitata
Reliabiliteetin ja validiteetin käsitteitä
Psykiatriassa reliabiliteetti ja validiteetti on usein vaikeampi saavuttaa kuin somaattisella puolella!
•Reliabiliteetti hyvä•Validiteetti huono
•Reliabiliteetti huono•Validiteetti huono
•Reliabiliteetti hyvä•Validiteetti hyvä
•Validiteetti ei voi olla hyvä, jos reliabiliteetti on huono
Construct validity (=rakennevaliditeetti) onko teoriakäsite riittävästi ja onnistuneesti
mitattu? Convergent validity (=yhtenevyys)
onnistuuko käsitteen mittaaminen muulla mittarilla
Discriminant validity (=erottelu) onnistuuko mittari erottamaan käsitteen muista
käsitteistä
Reliabiliteetin ja validiteetin käsitteitä
Blacker & Endicott 2000, Morgan et al. 2001
Content validity (=sisältövaliditeetti) Kattavatko kysymykset käsitteen riittävästi
Face validity (=näennäisvaliditeetti) Vaikuttaako mittari mittaavan sitä mitä on
tarkoitus
Reliabiliteetin ja validiteetin käsitteitä
Blacker & Endicott 2000, Morgan et al. 2001
Criterion validity (=kriteerivaliditeetti) Miten mittari liittyy muihin samaa asiaa mittaaviin
kriteereihin, esimerkiksi diagnoosiin Concurrent validity (=samanaikaisvaliditeetti)
Kuinka hyvin mittari ennustaa henkilön nykyistä tilaa
Predictive validity (=ennustevaliditeetti) Kuinka hyvin mittari ennustaa henkilön tulevaa tilaa
Reliabiliteetin ja validiteetin käsitteitä
Blacker & Endicott 2000, Morgan et al. 2001
Luotettavuuden testaaminen
Luokiteltu muuttuja Kappa, yhdenmukaisuus
Jatkuva muuttuja Intraclass korrelaatio (arvioiden tai
mittausten yhdenmukaisuus) Cronbachin Alpha
(kysymyslomakkeen sisäinen yhdenmukaisuus)
Voidaan testata joko arvioijien välillä (interrater) tai saman arvioijan kahden eri arvion välillä (test-retest)
Diagnostiseen testiin liittyviä käsitteitä Positiivisen tuloksen ennustearvo (positive predictive
value, PPV) Testillä oikein sairaaksi todettujen osuus kaikista
testipositiivisista Negatiivisen tuloksen ennustearvo (negative
predictive value, NPV) Testillä oikein terveiksi todettujen osuus kaikista
testinegatiivisista Herkkyys (sensitivity, se)
Testillä oikein tautia sairastaviksi todettujen osuus kaikista kyseistä tautia sairastavista
Tarkkuus (specificity, sp) Testillä oikein terveiksi todettujen osuus kaikista
kyseistä terveistä
Uhari. Duodecim 2004; 120: 935-41.
Arvioija B
Arvioija A Kyllä Ei Yhteensä
Kyllä a b g1
Ei c d g2
Yhteensä f1 f2 N
Reliabiliteetti
Havaittu yksimielisyys po = (a+d) / N
Sattuman mukaan odotettu yksimielisyys pe = (f1g1+f2g2) / N2
Kappa = (po-pe) / (1-pe)
Validiteetti (Arvioija B on oikeassa eli “kultainen standardi”, Arvioijan A validiteettia arvioijaan)
Sensitiivisyys Se = a / f1
Spesivisyys Sp = d / f2Positiivinen ennustearvo PPV = a / g1
Negatiivinen ennustearvo NPV = d / g2
Arvioija B
Arvioija A Kyllä Ei Yhteensä
Kyllä 35 15 50
Ei 25 125 150
Yhteensä 60 140 200
Reliabiliteetti
Havaittu yksimielisyys po = (35+125) / 200 = 0.80 (80%)Sattuman mukaan odotettu yksimielisyys pe = (50*60+140*150) / 2002 = 0.60 (60%)Kappa = (0.8-0.6) / (1-0.6) = 0.50
Validiteetti (Arvioija B on oikeassa eli “kultainen standardi”, Arvioijan A validiteettia arvioijaan)
Sensitiivisyys Se = 35 / 60 = 0.58 (58%)Spesivisyys Sp = 125 / 140 = 0.89 (89%)Positiivinen testituloksen ennustearvo PPV = 35 / 50 = 0.70 (70%)Negatiivinen testituloksen ennustearvo NPV = 125 / 150 = 0.83 (83%)
ROC -käyräReceiver Operating Characteristic (ROC)
Sens
itivi
ty
1 - Specificity
Cronbachin alpha
Perustuu varianssianalyysiin Kertoo kuinka yhdenmukaisesti mittarin eri
kysymykset mittaavat samaa asiaa (internal consistency)
Voidaan tehdä koko mittarille ja erikseen jokaiselle osa-asteikolle
DATA ESIMERKKI
VAR1 VAR2 VAR3 VAR4 VAR5...
CASE1 0 1 1 2 0 …CASE2 4 5 4 3 3 …CASE3 0 0 1 0 0 …CASE4 2 2 2 2 3 …CASE5 3 1 1 2 3 … . :
On esitetty erilaisia raja-arvoja, sille mikä on riittävä alpha
0.60 – 0.80, esim. 0.70 (Nunnally 1978) Alphan suuruuteen vaikuttaa kysymysten
lukumäärä, mitä enemmän sitä suurempi alpha
Muuttujien vinous ongelma, samoin jos sama vastaaja vastaa kaikkiin kysymyksiin samoin (=varianssi on tärkeä)
Cronbachin alpha
Nunnally (1978) Psychometric Theory
Esimerkkiaineisto
Pohjois-Suomen vuoden 1966 syntymäkohortin 31-vuotisseuranta
TCI (Temperament and Character Inventory) Reward Dependence –alaskaala
RD1 – Sentimentality RD3 – Attachment RD4 – Dependence
Kaksiluokkaisia muuttujia
Reliability Statistics
,689 24
Cronbach'sAlpha N of Items
Reliability Statistics
,610 10
Cronbach'sAlpha N of Items
Reliability Statistics
,706 8
Cronbach'sAlpha N of Items
Reliability Statistics
,490 6
Cronbach'sAlpha N of Items
RD – koko asteikko
RD – 4 Dependence
RD – 1 Sentimentality
RD 3 – Attachment
Tilasto-ohjelmia
SPSS (www.spss.com) SAS (www.sas.com) STATA (www.stata.com) R+ (cran.r-project.org) SUDAAN (www.rti.org/sudaan) Mplus (www.statmodel.com) StatsDirect (www.camcode.com) MetaWin (www.metawinsoft.com)
Käsitteitä Incidence Rate Ratio / Case Fatality Rate Ratio
Kahden ilmaantuvuuden / tapauskuoleisuuden suhde Stanzardized Mortality Ratio
Havaitut kuolemat / odotetut kuolemat Lisäriski (Attributable Risk, AR)
Riskimuuttujan omaavien henkilöiden lisäriski sairauteen Väestön lisäriski (Population Attributable Risk, PAR)
Sairaiden osuus väestössä mikä johtuu riskimuuttujasta Attributable Risk Reduction, ARR
Riskin väheneminen joka saadaan esim. Tutkittavalla hoidolla tai kun riskimuuttujan vaikutus poistettaisiin
Number Needed to Treat, NNT Kuinka paljon pitäisi potilaita pitäisi hoitaa jotta vältyttäisiin
yhdeltä vastetapahtumalta (esim. kuolema) NNT = 1 / ARR
http://www.vetmed.wsu.edu/courses-jmgay/GlossClinEpiEBM.htm
Yleisiä lähteitä tilastomenetelmiin suomeksi
Metsämuuronen. Tutkimuksen tekemisen perusteet ihmistieteissä (2003).
Nummenmaa ym. Tutkimusaineiston analyysi (1997).
Uhari. Biostatistiikan taskutieto (2002). Uhari & Nieminen. Epidemiologia & Biostatistiikka
(2001).
SPSS, SAS, jne. Oppaat