Mitmene testimine ülegenoomsetes uuringutes
description
Transcript of Mitmene testimine ülegenoomsetes uuringutes
![Page 1: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/1.jpg)
Mitmene testimine ülegenoomsetes uuringutes
Märt Möls
![Page 2: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/2.jpg)
Mitmese testimise probleemist
• Statistilisel testil on lubatud eksida (olulisuse nivool α=0,05 võivad kuni 5% testidest anda eksliku valepositiivse tulemuse...)
• 100 sõltumatu arulageda testi puhul:0,05*100=5 valepositiivset tulemust;
0,95100=0,0059 ehk tõenäosusega 0,6%
ei saa me ühtegi valepositiivset
tulemust.
![Page 3: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/3.jpg)
Mitmese testimise probleem on muidugi ammu teada...
Farmaatsiakompaniid kordavad kliinilisi katseid senikaua, kuni saavad statistiliselt olulise tulemuseVaata näiteks suhteliselt hästi dokumenteeritud ravimiga Seroxat - GlaxoSmithKline – seotud juhtumit:
Law, ethics and medicine: Seroxat and the suppression of clinical trial data: regulatory failure and the uses of legal ambiguity
L McGoey, E Jackson
J Med Ethics 2009;35:107-112 doi:10.1136/jme.2008.025361
![Page 4: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/4.jpg)
Mitmese testimise probleem on muidugi ammu teada...
![Page 5: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/5.jpg)
Geeniteaduses ei vii probleemi ignoreerimine kahjuks paljude artiklite ja
rikkuseni...
• Mõõdetakse ~300 000... ~2 000 000 SNP iga inimese kohta...
SNP – üksiku nukleotiidi polümorfism: ...CCCTGCCTCCCC(C/T)CCAGATGGCG...
• 600 000 SNP testimisel tõenäosus mitte saada valepositiivset tulemust: 1,4∙10-13366
Probleem on liiga ilmne tema ignoreerimiseks...
![Page 6: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/6.jpg)
Klassikalised lahendused
• Bonferroni meetod– Bonferron-Holm– Sidak
• FDR – valeavastusmäär
(fikseeritakse ülempiir valesti vastuvõetud alternatiivsete hüpoteeside osakaalule – näiteks valepositiivsete testitulemuste keskmine osakaal ei tohi olla üle 5%)
![Page 7: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/7.jpg)
Bonferroni meetodi põhiolemus
testil
2. viga
testil
1. viga
testil
2. viga
testil
1. viga
testil
2. viga
testil
1. viga ja ja/või PPPP
![Page 8: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/8.jpg)
Bonferroni meetodi põhiolemus
P(“valeavastus”) ≤ 0,05/2 +0,05/2 = 0,05
testil
2. viga
testil
1. viga
testil
2. viga
testil
1. viga
testil
2. viga
testil
1. viga
testil
2. viga
testil
1. viga
PP
PPPP ja ja/või
![Page 9: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/9.jpg)
Bonferroni meetodi puudused
• Ilmne puudus
Enamasti
• Esialgu märkamatuks jääv puudus:Arvutused olulisuse nivool 0,05 on lihtsamad kui olulisuse nivool 0,05/10000...
0testil
2. viga
testil
1. viga
jaP
![Page 10: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/10.jpg)
Näide eksitavast rusikareeglist
T-test: andmed olgu normaaljaotusega või olgu valim suur
![Page 11: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/11.jpg)
Peaaegu normaaljaotus?Histogramm
x
Sag
edus
0 2 4 6 8 10
010
2030
40
-3 -2 -1 0 1 2 3
02
46
810
Tõenäosuspaber (QQ-plot)
![Page 12: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/12.jpg)
Mittetöötava rusikareegli näide:t-test, “suur valim” (n=100)
kasutatud vale testitulemuseolulisuse nivoo (I liiki vea) tõenäosus
0,05 0,05040,0005 0,000530,000005 0,00000730,000005 (ühepoolne) 0,000011
0,000011*10000 ≠ 0,05
Bonferroni meetod võimendab üles ka kõige pisema eksimuse eeldustes suureks probleemiks.
![Page 13: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/13.jpg)
Probleemsed võivad olla ka mitteparameetrilised testid...
Kui me ei riski teha eelduseid uuritava tunnuse jaotuse kohta, siis kasutame mitteparameetrilisi teste? Wilcoxon, Kruskal-Wallis, ...?
Iseenesest hea idee, aga...... statistikatarkvara (R,SAS, ...) kasutab enamike nende testide puhul ligikaudseid meetodeid olulisustõenäosuse (p-value) arvutamiseks...
![Page 14: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/14.jpg)
Mida siis teha?
Permutatsioonitest?
1. Paiguta fenotüübi väärtused juhuslikult;
2. leia olulisustõenäosus (p-väärtus) kõigi testide ehk kõigi SNP’de jaoks;
3. leia väikseim p-väärtus kõigi testide seast;
4. korda samme 1-3 palju kordi (näiteks 10000 korda);
5. vaata, kui sageli kohtasid sind huvitavast
p-väärtusest pisemaid p-väärtuseid...
![Page 15: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/15.jpg)
Seos inimese sotsiaalsuse ja genotüübi vahel -
koostöö prof J. Alliku ja prof. M. Remmiga
Teste (SNP’e): 299 280
Inimesi: 596
Parim p-väärtus: 0,00000072
Bonferroni otsus: 0,00000072 > 0,05/299280 (= 0,000000167)
299280*0,00000072 > 0,05
0,215 > 0,05
Seose olemasolu ei saa tõestada...
![Page 16: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/16.jpg)
Bonferroni vs permutatsioonitest
• Bonferroni korrigeeritud p-väärtus:299280*0,00000072 = 0,215
• Permutatsioonitest, 0,17 (≈236000*0,00000072)
Efektiivne testide arv: 236 000
Kirjandusest: 500 000 SNP’i -> ef. teste ~ 260 000Piirväärtus teatud juhul (α=0,05,...) ~650 000
![Page 17: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/17.jpg)
Kuidas edasi?
SNP asemel testida piirkondade olulisust?
Vaatame näiteks 100 SNP pikkuseid juppe?
Esialgne hinnang: p-väärtus ~0,03 ???
![Page 18: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/18.jpg)
Lootust on...
Kahtlane piirkond on geeni KCNV2 ees ja sees...
Mutatsioonid geenis KCNV2 põhjustavad veidrusi värvide tajumisel...
Kes näevad kaasinimesi roosades toonides, suhtlevad nendega ka meelsamini?
![Page 19: Mitmene testimine ülegenoomsetes uuringutes](https://reader033.fdocuments.net/reader033/viewer/2022061509/56815086550346895dbe846c/html5/thumbnails/19.jpg)
Tänan!