Měření asociací v epidemiologických studiích

Post on 10-Jan-2016

38 views 2 download

description

Měření asociací v epidemiologických studiích. Marek Malý. Individuální a skupinová data. Klinický přístup (=individuální) Lékař vždy léčí konkrétního pacienta, ale každý pacient se podstatným způsobem v mnoha rysech liší od jiných pacientů Skupinový přístup - PowerPoint PPT Presentation

Transcript of Měření asociací v epidemiologických studiích

Měření asociacív epidemiologických studiích

Marek Malý

Individuální a skupinová data

• Klinický přístup (=individuální)– Lékař vždy léčí konkrétního pacienta, ale každý pacient se

podstatným způsobem v mnoha rysech liší od jiných pacientů

• Skupinový přístup– Vzhledem k velké variabilitě biologického materiálu nevyplývá

z jednoho pozorování žádná obecná informace. Nutno popsat a porovnat rozložení dat u skupin osob.

• Zabývá se studiem a kvantifikací výskytu nemocí ve skupinách lidí.

• Soustřeďuje se na vyhodnocování hypotéz o příčinách

nemocí a hledá souvislosti mezi výskytem nemoci a charakteristikami osob a jejich životního prostředí.

Epidemiologie

• Formulace teoretického problému• Formulace pracovních hypotéz• Stanovení primárních a sekundárních cílů studie• Rozhodnutí o cílové a studované populaci, opora výběru• Plán studie, rozsah výběru• Rozhodnutí o technice sběru informací• Konstrukce nástrojů pro tento sběr (dotazníky, …)• Pilotní studie / Předvýzkum• Sběr dat• Vkládání dat do počítače, kontrola chyb• Vlastní analýza dat• Interpretace, závěry, případné zobecnění

Kroky při realizaci studie

• OBSERVAČNÍ (POZOROVACÍ)

[DESKRIPTIVNÍ, ANALYTICKÉ]

» popisy jednotlivých případů či série případů

– ekologické studie

– průřezové studie

– studie případů a kontrol

– kohortové studie

• INTERVENČNÍ (EXPERIMENTÁLNÍ)

– klinické studie

– terénní intervenční studie

Typy epidemiologických studií

• Kvantitativní (numerické)– diskrétní (zpravidla celočíselné - počty)– spojité (jakákoli hodnota v určitém rozsahu je možná; omezení dáno jen

přesností měření)

• Kvalitativní (kategoriální)– binární (dvě kategorie; ano-ne)– nominální (několik kategorií bez uspořádání)– ordinální (několik kategorií s uspořádáním)

Typy jevů a proměnných

• Popis frekvence výskytu onemocnění: incidence, prevalence

• Zkoumání vztahu mezi dvěma proměnnými

– Expozice (rizik. faktor): ano x ne, příp. ordinální či spojitá vel.

– Následek (onemocnění): ano x ne, příp. ordinální veličina

• Ukazatele asociace (síly vztahu): RR, OR, AR, SMR

• Testy hypotéz o síle asociace

• Otázky o kauzalitě

• Faktory ovlivňující správnou interpretaci zjištěné asociace

– zkreslení (bias)

– zavádějící faktor (confounder) – „třetí proměnná“

– náhoda (chance)

Základní cíle observačních studií

• Podíl, proporce, rel. četnost (proportion) – bezrozměrný podíl, v němž čitatel je součástí

jmenovatele, odhaduje riziko• podíl počtu chlapců v celk. počtu narozených dětí

• Poměr (ratio)– čitatel není součástí jmenovatele; má rozměr

• poměr počtu narozených dívek k počtu narozených chlapců

• Míra (rate)– speciální forma podílu zahrnující specifikaci času

• počet úmrtí na součet osobočasů v riziku

Podíl, měra, míra

• za každou osobu se do ukazatele přičte příspěvek odpovídající délce jejího sledování – „době strávené v riziku“ (ve dnech, v rocích)

• 12 osob sledovaných po dobu 1 měsíce přispívá stejně jako 1 osoba sledovaná 1 rok

• u velké populace zhruba stejné jako: průměrná velikost populace x délka sledování

významná úloha ve jmenovateli, kde mají být jen osoby „v riziku“

Koncepce osoba-čas(Person-years)

• požadavek kvantifikace výskytu nemoci je v epidemiologickém sledování klíčový

• je třeba znát– absolutní počet nemocných– velikost populace, z níž nemocní pocházejí– časové období, ve kterém byly údaje shromážděny

• ukazatelé četnosti (frekvence) nemoci - tzv. ukazatelé nemocnosti - jsou tedy mírou množství nemoci v určitém místě a čase; zpravidla se vyjadřují jako procento či na 1000, resp. 100000 obyvatel

Měření frekvence nemoci

• Incidence charakterizuje, kolik nových případů se objevilo v populaci v daném časovém intervalu (často roce); vlastně je ukazatelem dynamiky onemocnění, rychlosti nárůstu

• Prevalence informuje o úrovni nemocnosti v určitém okamžiku, popisuje podíl případů nemoci existujících např. v daném dni (okamžitá), případně měsíci atp. (intervalová)

• Ukazatele se vztahují na počet exponovaných osob, resp. na součet období, po která byly osoby sledovány (osobočas)

Prevalence a incidence

počet všech osob se zkoumaným onemocněním

ve studované populaci v daném okamžiku (Okamžitá) prevalence = ------------------------------------------ počet osob v populaci ve stejném okamžiku

počet případů onemocnění, které se vyskytly ve studované populaci v daném časovém intervalu Intervalová prevalence = --------------------------------------------- součet osobočasů v populaci ve stejném časovém intervalu

počet nově zjištěných případů onemocnění ve studované populaci v daném časovém intervalu Incidence = --------------------------------------------- součet osobočasů v populaci ve stejném časovém intervalu

počet nově zjištěných případů onemocnění ve studované populaci v daném časovém intervalu Incidence = --------------------------------------------- střední stav studované populace

Prevalence a incidence

• Změna incidence odráží změnu v etiologických faktorech (rizikových, protektivních)

• Změna prevalence odráží změnu v incidenci,v délce trvání onemocnění či v obojím

• Úroveň prevalence závisí na zakončení nemoci (uzdravení, úmrtí)

• Pokud jsou prevalence, incidence i délka stabilnía prevalence < 10 %, platí přibližně

prevalence incidence prům. délka onemocnění

Incidence a prevalence

Průřezová studie

• Výběr jedinců do studie probíhá k jednomu časovému okamžiku - obecně bez znalosti expozice a nemoci

• Může zjišťovat prevalenci jak expozice tak nemoci• Vhodné zejména pro nemoci, které nejsou rychle

fatální, nevhodné pro vzácné nemoci či expozice+ Relativně snadný sběr dat, relativně levné– Citlivé vzhledem ke zkreslení (bias)– Nelze stanovit, zda byla dříve expozice či nemoc

(kauzalita)

Průřezová studie

• NHANES (National Health and Nutrition Examination Survey)

• MONICA

Průřezová studie - příklady

Kohortová studie

• PRINCIP: Vytvoření skupin na základě údaje o expozici a kompletní dlouhodobé sledování všech skupin (follow-up) stejným způsobem; možno sledovat (v podobě incidence) celé spektrum následků jedné expozice (více nemocí)

• Na začátku zařazeny jen osoby bez onemocnění• Organizace studie: prospektivní, retrospektivní (historická)+ Nejúplnější a flexibilní popis vývoje od expozice k nemoci+ Může objasnit časové souvislosti mezi expozicí a nemocí, zachytit

dynamiku vzniku zkoumané závislosti+ Vhodné pro vzácně se vyskytující expozice (příčiny)+ Odolnost vůči výběrovému zkreslení– Naprosto nevhodná pro nemoci se vzácným výskytem– Velké finanční a časové nároky– Validitu narušují ztráty jedinců ze sledování

Kohortová studie

Nemoc

Expozice ano ne Celkem

ano a b a+b

ne c d c+d

Celkem a+c b+d n=a+b+c+d

Kohortová studie

Nemoc

Expozice ano ne Osobočas

ano a - PY1

ne c - PY0

Celkem a+c - T=PY1+PY0

Kohortová studie

• Studie britských lékařů

• Studie horníků uranových dolů

• Framinghamská studie

Kohortová studie - příklady

Studie případů a kontrol

• PRINCIP: porovnání podílu osob exponovaných zkoumanému (rizikovému) faktoru ve skupině nemocných (PŘÍPADY) a zdravých (KONTROLY)

+ Vhodné pro studium incidence nemocí vzácných a s dlouhou latencí

+ Lze studovat více potenciálních příčin nemoci– Založeno na popisu expozice v minulosti –

potenciálně nepřesné záznamy či vzpomínky - zkreslení

– Neúplná kontrola vlivu dalších proměnných – Často obtížná volba kontrolní skupiny, ta přitom

podstatně ovlivňuje validitu– Nelze přímo popsat incidenci mezi exponovanými a

neexponovanými

Studie případů a kontrol

n=a+b+c+db+da+cCelkem

c+ddcne

a+bbaano

CelkemKONTROLAPŘÍPADExpozice

Status

Studie případů a kontrol

• Kouření a rakovina plic (Doll, Hill, BMJ 1950)

• Alkohol a rakovina jícnu (viz Breslow, Day I, 1980)

• Hormonální antikoncepce a infarkt myokardu (Rosenberg, Am. J. Epidemiol. 1980)

• Konzumace kávy a rakovina slinivky břišní (MacMahon, NEJM, 1981)

Studie případů a kontrol - příklady

• Studie případů a kontrol často slouží k prvnímu prověření hypotézy a z nich vycházejí podrobnější a přesnější kohortové studie.

• V tzv. vnořené studii případů a kontrol (nested case-control study) jsou případy a kontroly vybírány z již existující kohorty, a je pro ně proto k dispozici základní informace o expozici rizikovým faktorům. Detaily se pak dohledávají jen pro menší počet jedinců zařazených ve vnořené studii (zejména se redukuje počet zdravých), což je výhodné zvláště tehdy, když je dohledání nákladné.

• Studie případů v kohortě (case-cohort study) je založena na analýze dat osob ze subkohorty (vybrané v úvodu kohortové studie) a všech případů onemocnění.

Vztah kohortové studie ke studii případů a kontrol

• Relativní riziko

• Poměr šancí

• Atributivní riziko

• Standardizovaný úmrtnostní index (SMR)

UKAZATELE ASOCIACE

• RIZIKO (RISK) - pravděpodobnost výskytu sledovaného jevu; odhadujeme ji pomocí relativní četnosti (počet nemocných ku počtu všech osob ve skupině); mezi 0 a 1

• V exponované skupině: R1=a/(a+b)

• V neexponované skupině: R2=c/(c+d)

(ABSOLUTNÍ) RIZIKO

Bakteriální infekce močových cest

Orální antikoncepce

ano ne Celkem

ano 27 455 482

ne 77 1831 1908

Celkem 104 2286 2390

•R1 = 27 / 482 = 0,056•R2 = 77 / 1908 = 0,040

•RR = R1 / R2 = 1,39•95% CI: (0,91; 2,13)•χ2 = 2,27; p=0,132

Kohortová studie

• Interval spolehlivosti pro RR lze použít při testování významnosti: testuje se H0: RR=1 (hodnota 1 odpovídá tomu, že není žádný rozdíl v riziku onemocnění mezi exponovanou a neexponovanou populací).

• Pokud hodnota 1 není pokryta 100(1-α)% intervalem spolehlivosti, nulovou hypotézu lze zamítnout na hladině α [např. 95% CI, α=0,05], v opačném případě H0 nezamítáme.

• Oproti p-hodnotě získáme navíc představu o přesnosti odhadu parametru a o tom, zda rozsah výběru byl dostatečně veliký.

Interpretace intervalu spolehlivosti

• poměr rizika onemocnění v exponované a v neexponované populaci• ukazatel asociace odhadující sílu vazby mezi expozicí

a nemocí• vyjadřuje, kolikrát je větší riziko následku u exponovaných v porovnání s

neexponovanými

• RR může nabývat hodnot mezi 0 a nekonečnem• RR=1 .. není vztah mezi expozicí a následkem• RR>1 .. pozitivní vztah• RR<1 .. inverzní vztah (expozice chrání před následkem)

Relativní riziko

1

0

0

1

0

1

01

PY.c

PY.a

PY/c

PY/a

ID

IDRR

)ba.(c)dc.(a

)dc/(c)ba/(a

RR

RR

Relativní riziko RR

• ŠANCE (ODDS) - poměr pravděpodobnosti,že ke sledovanému jevu došlo, vzhledem k pravděpodobnosti, že k tomuto jevu nedošlo(počet nemocných ku počtu zdravých);mezi 0 a nekonečnem

• V exponované skupině: [a/(a+b)] / [b/(a+b)]=a/b

• V neexponované skupině: [c/(c+d)] / [d/(c+d)]=c/d

Šance (ODDS)

Infarkt myokardu

Orální antikoncepce

ano

(případ)ne (kontrola) Celkem

ano 23 304 327

ne 133 2816 2949

Celkem 156 3120 3276

•O1 = 23 / 304 = 0,076•O2 = 133 / 2816 = 0,047

•OR = O1 / O2 = 1,60•95% CI: (0,99; 2,58)•χ2 = 4,13; p=0,042

Studie případů a kontrol

• Interpretace OR je podobná jako u RR,ovšem s použitím šance místo rizika

• OR může nabývat hodnot mezi 0 a nekonečnem

• OR je jediná možnost charakterizace velikosti asociace ve studii případů a kontrol

• OR je dobrým odhadem relativního rizika, pokud je výskyt onemocnění v populaci relativně nízký

• U onemocnění s častým výskytem (vysokou prevalencí) je nutno RR a OR považovat za dva různé ukazatele

ODDS RATIO – poměr šancí OR

c.bd.a

d/cb/a

OR

dcbapokud

ORdcba

dccbaa

RR

,

//

)/()/(

ODDS RATIO – poměr šancí OR

cbda

dcba

dcddccbabbaa

OR..

//

)]/(/[)]/([)]/(/[)]/([

cbda

dbca

dbddbbcaccaa

OR..

//

)]/(/[)]/([)]/(/[)]/([

• Disease odds ratio

• Exposure odds ratio

ve studii případů a kontrol se zpravidla z populace nevybírá stejný podíl nemocných a zdravých odhad relativního rizika by byl zkreslený, lze odhadovat jen podíly exponovaných mezi zdravými a mezi nemocnými

ODDS RATIO – poměr šancí OR

Sledovaný faktor

Úmrtí

ano neCelkem

přítomen 2 98 100

nepřítomen 1 99 100

Celkem 3 197 200

Pravděpodobnost 1/3 šance 1/2; pravděpodobnost 1/100 šance 1/99Úmrtí: RR=(2/100)/(1/100) = 2; OR=(2/98)/(1/99) 2Přežití: RR=(98/100)/(99/100) 1; OR=(98/2)/(99/1) 0,5

Vztah mezi šancía pravděpodobností

• pravděpodobnost, že za platnosti nulové hypotézy H0 nastane právě takový výsledek,jaký byl pozorován, nebo ještě extrémnější(tj. vzdálenější od H0)

• malá p-hodnota svědčí proti platnosti H0

• význam slova „malá“ určuje předem zvolená hladina významnosti α, na níže se testování provádí (typicky α=0.05)

• kdybychom zvolili hladinu významnosti právě rovnou p-hodnotě, byl by výsledek přesně na hranici statistické významnosti

P-hodnota (P-VALUE)

dccbaaRRSE

caRRSE

eRReRR RRSEzRRSEz

1111))(ln(

11))(ln(

).,.( ))(ln(.))(ln(. 2/2/

dcbaORSE

eOReOR ORSEzORSEz

1111))(ln(

).,.( ))(ln(.))(ln(. 2/2/

Intervaly spolehlivosti

• Čistě statistickými postupy nelze prokázat, zda vztah mezi veličinami je či není kauzální – testuje se, zda existuje asociace/vazba

• Čím větší je RR nebo OR, tím lze spíše očekávat, že vztah mezi expozicí a následkem je kauzální, i když tomu tak nemusí být ani u velmi silné vazby

• Pro úvahy o kauzalitě nutno dále posoudit: časový sled, specificitu (příčiny a následku), soulad s dosud známými fakty, biologickou plausibilitu, konzistenci závěrů různých studií

• Pro interpretaci je kromě vlastní hodnoty RR (OR) vždy nutná znalost intervalu spolehlivosti a rozsahu výběru

Síla asociace, kauzalita

Jaký je rozdíl ve výpovědi o síle asociace v následujících situacích?

OR #1: OR = 1.4 95% CI = (0.7 - 2.8)

OR #2: OR = 1.4 95% CI = (1.2 - 1.7)

OR #3: OR = 9.8 95% CI = (1.8 - 21.3)

OR #4: OR = 6.6 95% CI = (5.9 - 8.1)

Síla asociace

Příčina úmrtí

Pozorovaná úmrtí (O)

Očekávaná úmrtí (E)

SMR (O/E)

(95% int. spol.)

Ca plic 704 138,6 5,08 (4,71-5,47)

Ca jater 22 13,2 1,67 (1,04-2,52)

Ca žlučníku 12 5,3 2,26 (1,16-3,94)

SMR – standardizovaný úmrtnostní indexE – počet případů, který by se v kohortě vyskytl, kdyby v ní platily stejné věkově specifické úmrtnosti jako v obecné populaci ČR

Kohortová studie – horníci českých uranových dolů, expozice radonu a jeho dceřiným produktům

• Ukazatel AR udává, za jakou část případů nemoci je zodpovědná expozice (za předpokladu příčinného vztahu mezi zkoumanou expozicí a následkem).

• Takto můžeme popsat počet případů nemoci mezi exponovanými, které by se nevyskytly, kdybychom dokázali zcela eliminovat expozici.

• Z praktického hlediska je takto dáno maximální snížení nemocnostiu exponovaných osob, kterého lze dosáhnout odstraněním rizikového faktoru.

• Na rozdíl od relativního rizika, které měří sílu asociace mezi expozicí a následkem, atributivní riziko je mírou dopadu této asociace v kontextu studia veřejného zdraví.

• V porovnání s RR se však ze zjištěné hodnoty AR rizika jen velmi těžko vyvozují zobecnění na jiné populace, neboť AR silně závisína incidenci/prevalenci v neexponované skupině.

Atributivní riziko AR

0101

01

PY

c

PY

aIDIDRD

dc

c

ba

aRRRD

Rozdíl rizik (atributivní riziko)

• Převrácená hodnota rozdílu rizik, NNT=1/RD,je speciální měrou počtu osob, které připadajína každý další případ nemoci, resp. které bybylo třeba ošetřit, aby se předešlo vzniku jednoho případu.

Potřebný počet léčených (Number needed to treat)

• Odhad podílu nemocných mezi exponovanými, který jde na vrub expozice, „AR v procentech“

%.OROR

AF

%.IDIDID

AF

%.RRR

AF

1001

100

100

1

01

1

01

Atributivní frakce

• Incidence leukémie– IE = 9 / 23286 38,65 na 100000– IĒ = 18 / 244159 7,37 na 100000

• RR = 38,65 / 7,37 = 5,24– 95% CI: (1,93; 10,96) [relativní riziko]

• RD = 38,65 - 7,37 31,28 na 100000– 95% CI: (17,77; 44,78) [rozdíl rizik]

• AF=(38,65 - 7,37) / 38,65 80,9 % – 95% CI: (57,54; 91,43) [atributivní frakce]

Kohortová studie s osoboroky – horníci českých uranových dolů

Anti- koncepce

Ca vaječníků

OsoborokyRizika (rates)

na 100000

Někdy 29 345000 8,4

Nikdy 45 321429 14,0

RR (rate ratio) = 8,4 / 14,0 = 0,60RD (risk reduction) = 8,4 na 100000 – 14,0 na 100000 = 5,6 na 100000 PF (prevented fraction) = 1-RR = 5,6 / 14,0 na 100000 = 0,40 na 100000 40 % (zabráněná frakce)

Hypotetická kohortová studie – protektivní účinky antikoncepce vzhledem k rakovině

vaječníků

• Podíl onemocnění v celé studované populaci exponovaných i neexponovaných, kterým by se předešlo eliminací expozice

• PE ... odhad podílu exponovaných v populaci pomocí podílu exponovaných v kontrolní skupině

%100.1)1()1(

RRPRRP

AFPE

E

Populační atributivní frakce

• Úloha náhodné chyby (kontrolována na hladině významnosti)

• Systematická chyba – bias (zkreslení)

– confounding (zavádějící, matoucí, rušivý faktor)

– ztráty ze sledování

Interpretace studií

Zkreslení (bias)

Jakákoli systematická chyba, která vznikne při sběru dat, jejich analýze, interpretaci, publikaciči kontrole a která vede k závěrům systematickyse lišícím od skutečnosti.

• Výběrové zkreslení • Informační zkreslení• Publikační zkreslení

EXPOZICE(konzumace alkoholu)

CONFOUNDING(kouření cigaret)

NÁSLEDEK(rakovina plic)

Zavádějící faktor (Confounding factor)

• Confounding je zkreslení ukazatelů asociace (např. RR nebo OR), které může vzniknout proto, že jsme nekontrolovali další proměnné, které jsou rizikovým faktorem pro studovaný jev (nemoc)

• Ignorování účinku zavádějícího faktoru vede k chybným odhadům velikosti účinku (které jsou zatíženy zkreslením/bias)

• Bez možnosti korekce (adjustace) pozorovaného výsledku vzhledem k účinkům zavádějících faktorů není možné odlišit jejich účinek od účinku expozice

• Adjustace vzhledem k faktoru, který je způsoben zčásti expozicí a je korelován s výsledkem, může do studie zanést bias

Koncept confounding

1. Musí být ve vztahu (přímém nebo nepřímém) k následku (rizikový faktor pro výskyt jevu)– Faktor musí být skutečnou příčinou nemoci

(jinou než studovaná expozice) nebo alespoň indikátorem,markerem rizika

– Asociace není sekundární (zprostředkovaná pouhou asociací faktoru s expozicí, která je příčinou nemoci)

2. Musí být (v cílové populaci) asociován se studovanou expozicí– Faktor musí být asociován se studovanou expozicí

ve zdrojové populaci (populaci v riziku, v které vznikly studované případy)

3. Nesmí být pouze mezikrokem v řetězci kauzálních dějůod expozice k výskytu studovaného jevu/ následku – Mechanismem účinku se liší od expozice

Zavádějící faktor – definiční kritéria

• PŘI PLÁNOVÁNÍ STUDIE– restrikce– strukturální vyvažování (matching)– randomizace

• PŘI ANALÝZE STUDIE(potenciální zavádějící faktory musí být identifikovány již při

plánování studie a zaznamenány / změřeny při sběru dat) – standardizace– stratifikace (Mantelova-Haenszelova technika)– logistická regrese– složitější modely (analýza rozptylu, Coxův model)

Kontrola vlivu zavádějících faktorů

• Hrubé

• Specifické

• Standardizované(přímá a nepřímá standardizace)

Ukazatele zdravotnické statistiky

• Chceme-li porovnávat určité ukazatele, např. úmrtnosti mezi oblastmi, nebo v delším časovém období, nelze používat absolutní ani relativní počty zemřelých (hrubou úmrtnost), a to kvůli závislosti takových ukazatelů na věkovém složení oblasti a skladbě obyvatel podle pohlaví.

• Metoda přímé standardizace provede přepočet všech údajů,které se mají porovnat, na jednu stejnou pevnou populaci(např. evropský standard - populace 100 000 osob,která má zastoupení jednotlivých věkových skupin zhruba na úrovni průměrného evropského státu v sedmdesátých letech).

• Standardizovaná úmrtnost je hypotetický ukazatel, který říká,jaká by byla úmrtnost ve fiktivní standardní populaci, pokud by tam platily stejné zákonitosti umírání jako v dané sledované populaci v daném čase. Sama o sobě nemá příliš velký smysl,ale je nezastupitelná pro účely srovnávání

Přímá standardizace

Přímá standardizace

• Základní princip: vytvořit podle hodnot kategoriální „třetí proměnné“ tzv. strata, vrstvy a hodnotit nejprve asociaci v každém stratu zvlášť – pomocí RR, OR, AR

• Pokud to je vhodné, vytvořit celkový odhad asociace adjustovaný vzhledem k stratifikující proměnné

• Ne vždy však představuje uvažovaná další proměnná další zavádějící faktor, může mít i jiné postavení

Stratifikace

• při posuzování asociace mezi expozicí a onemocněním může vystupovat „třetí proměnná“ v několika pozicích– zavádějící faktor (confounder)– faktor modifikující účinek (dochází k interakci)– mezikrok v řetězci kauzálních dějů– bez efektu

• Zavádějící faktor způsobuje zkreslení• Faktor modifikující účinek poskytuje důležitou informaci

Stratifikace

Faktor modi- fikující účinek

+

_

Interakce:

ÚČINEK EXPOZICE SE LIŠÍ V ZÁVISLOSTI NA HODNOTÁCH TŘETÍ PROMĚNNÉ

D

M C

Mezikrok

v příčinné

posloupnosti

bez efektu

Confounding:

ALTERNATIVNÍ VYSVĚTLENÍ VZNIKU ONEMOCNĚNÍ

Možné postavení „třetí proměnné“ při posuzování asociace mezi expozicí (E) a onemocněním (D)

Nemoc

Expozice ano ne Celkem

ano ai bi ai+bi

ne ci di ci+di

Celkem ai+ci bi+di ni

Kohortová studie – i-té stratum

NásledekExpozice Ano Ne Celkem

Ano 130 90 220Ne 70 110 180

Celkem 200 200 400

Odds ratio: 2,3

Následek NásledekExpozice Ano Ne Celkem Expozice Ano Ne Celkem

Ano 120 60 180 Ano 10 30 40Ne 40 20 60 Ne 30 90 120

Celkem 160 80 240 Celkem 40 120 160

Odds ratio: 1,0 Odds ratio: 1,0

• Hrubá (crude) analýza nebere v úvahu žádnou další proměnnou• Odhady velikosti relativního rizika specifické pro jednotlivá strata neindikují žádnou asociaci mezi expozicí a následkem

Zavádějící faktor

• Zkonstruovat souhrnný ukazatel asociace jako vážený průměr ukazatelů z jednotlivých strat, např. (wiORi) / wi ; tím se vezme v úvahu informace každého strata a jejich rozdílnosti z pohledu ukazatele asociace

• různé možnosti volby vah, závisí na typu ukazatel (OR, RR, AR) i povaze dat– Woolf (1955)– Mantel-Haenszel (1959)

• Pokud je vliv zavádějícího faktoru podstatný (hrubý a stratifikovaný ukazatel se podstatně liší), nemá hrubý ukazatel smysl– podstatná odlišnost: často se bere 10 %, ale nutno

postupovat s ohledem na povahu problému

Ošetření vlivu zavádějícího faktoru

• Zobecnění 2 statistiky pro test nezávislosti v jedné čtyřpolní tabulce zde jde o test nezávislosti při současné kontrole vlivu zavádějícího faktoru

• Testuje nulovou hypotézu, že v žádném ze strat neexistuje asociace mezi expozicí a onemocněním

• Testová statistika se (bez ohledu na počet strat) porovnává s kritickou hodnotou 2 rozložení o 1 stupni volnosti

• Na tento test lze také nahlížet jako na test hypotézy ORMH=1; lze ovšem také testovat pomocí intervalu spolehlivosti

• Pozor: výsledek MH 2 testu může být statisticky nevýznamný nejen, když celkově asociace skutečně neexistuje, ale také tehdy, když ukazatele v dílčích tabulkách, které dominují, nebudou homogenní, či budou dokonce protichůdné

Mantelova-Haenzelova statistika 2

Expozice (asbest)

případ kontrola CelkemRel. četnost

exponovaných

ano 197 237 434 mezi případy71,64/10

0

ne 78 294 372 mezi kontrolami

44,63/100

Celkem 275 531 806• Poměr šancí: 3,13; 95% CI: (2,29; 4,28)• Atributivní frakce: 68,1 %; 95% CI: (56,3; 76,7)• 2=53,16; P<0,001

Asociace mezi expozicí asbestu a mesoteliomem pleury u horníků

KUŘÁCINemoc

(mesoteliom)

Expozice (asbest)

ano ne Celkem

ano 169 167 336

ne 66 214 280

Celkem 235 381 616

OR = 3,28; 95% CI: (2,31; 4,65)

NEKUŘÁCINemoc

(mesoteliom)

Expozice (asbest)

ano ne Celkem

ano 27 70 97

ne 12 80 92

Celkem 39 150 189

OR = 2,67; 95% CI: (1,26; 5,64)

• Poměr šancí (hrubý): 3,13; 95% CI: (2,29; 4,28)• Poměr šancí (Mantel-Haenszel): 3,16; 95% CI: (2,32; 4,31)• 2 (Mantel-Haenszel): 52,74; P<0,001

Stratifikovaná studie případů a kontrol

• Odlišné ukazatele asociace v jednotlivých stratech (třeba v závislosti na kouření)

• Např.vztah mezi užíváním orální antikoncepce a infarktem myokardu je modifikován kouřením – je jiný pro kuřačky a jiný pro nekuřačky

• Homogenitu strat z pohledu míry asociace je možno formálně testovat pomocí speciálních 2 testů– Woolf – Breslow-Day

• Tyto testy fungují dobře až při větších rozsazích výběrů, někdy jsou pak ale až příliš citlivé nutno doplnit expertním posouzením

Modifikace efektu

NásledekExpozice Ano Ne Celkem

Ano 130 90 220Ne 70 110 180

Celkem 200 200 400

Odds ratio: 2,3

Následek NásledekExpozice Ano Ne Celkem Expozice Ano Ne Celkem Ano 100 60 160 Ano 30 30 60Ne 20 50 70 Ne 50 60 110 Celkem 120 110 230 Celkem 70 90 170

Odds ratio: 4,2 Odds ratio: 1,2

•OR ve stratech se diametrálně liší•Hrubý ani vážený/adjustovaný odhad nemá smysl•Nutno publikovat OR pro všechna strata

Modifikace efektu

Faktor modifikující účinek?

anone

Zavádějící faktor?

anone

uvádět stratum-specifické odhady, nikoli sumární

uvádět “adjustované” sumární odhady (Mantel-Haenszel)

Bez efektu: uvádět hrubé odhady

Mezikrok v příčinné posloupnosti (expertní posouzení)?

uvádět hrubé odhady ne ano

Postup posouzení postavení „třetí proměnné“

• Modeluje vztah (asociaci) mezi jednou či více vysvětlujícími proměnnými xi, které mohou být

– dichotomické (ano/ne)– kategoriální (socio-ekonomický status, ... )– spojité (věk, ...)

a– dichotomickou (binární) proměnnou Y

• Charakterizace „následku“ dichotomickou proměnnou je nejběžnější situací vyskytující se v biologii a epidemiologii

• Kódování Y – 1=pozitivní odpověď / přítomnost určité charakteristiky (výskyt

znaku / onemocnění či naopak přežití)– 0=negativní odpověď / nepřítomnost charakteristiky

Logistická regrese

• Průměr binární veličiny si lze představovat jako pravděpodobnost, pak se bude zkoumat, jak je např. pravděpodobnost ICHS závislá na věku (a případně i na dalších proměnných, třeba kuřáckých návycích)

• Značení– y .. ICHS (1=ano, 0=ne)– P .. pravděpodobnost ICHS– x .. věk

• Snaha použít místo zde nevhodného modelu lineární regrese y=α + βx model P=α + βx, ale P je pravděpodobnost a má být mezi 0 a 1

• Proto se modeluje ln[P/(1-P)]= α + βx, tzv. logit(P)• Změna v pravděpodobnosti není úměrná změně v x lineárně, závisí

na hodnotě x nelineární model (logistická funkce)• P/(1-P) je šance (odds) odpovědi „ano“ při dané hodnotě x

Logistická regrese

0,0

0,2

0,4

0,6

0,8

1,0

Pravdě-podobnost onemocnění

x

Logistická regrese

• Poměr šancí e říká, kolikrát se změní šance (odds) na pozitivní výsledek

– při změně x z 0 na 1 (v případě dichotomické veličiny)

– při změně x o 1 jednotku (obecně, u spojité veličiny)

• = změna logaritmu poměru šancí (OR) při jednotkové změně v x

eodds βxαP-1

P +==

eodds

eodds

exp|nem

exp|nem

=

= +

Interpretace koeficientu β

b = 0 (eb=1) pravděpodobnost výskytu znaku je stejná na všech úrovních x, není asociace mezi x a y

b > 0 (eb>1) pravděpodobnost výskytu znaku se s rostoucím x zvyšuje

b < 0 (eb <1) pravděpodobnost výskytu znaku se s rostoucím x snižuje

• Lze testovat nulovou hypotézu H0: b=0 proti H1: b0 (Waldův test)

Interpretace koeficientu β

• Obecně lze do modelu zařadit více nezávisle proměnných (xi) různých typů

– Dichotomická, ordinální, nominální, spojitá …• logit(P)=ln[P/(1-P)]= α + β1x1 + β2x2 + ... + βkxk

• P/(1-P) je šance odpovědi „ano“ při hodnotách x1 až xk

• Interpretace bi – změna logaritmu poměru šancí (OR) při jednotkové změně v jedné

konkrétní nezávisle proměnné xj při stejných (nezměněných) hodnotách všech ostatních xi, ij

– Míra asociace mezi xj a logaritmem poměru šancí adjustovaná vzhledem k vlivu všech ostatních xi zahrnutých v modelu

– eβi lze opět interpretovat jako poměr šancí

Vícenásobná logistická regrese

• Sledováno přežívání v závislosti na věku a pohlaví logit(P)= α + β1AGE + β2FEMALE

• Odhady (SPSS)

b S.E. Wald DF Sig.

(P-value)

OR=

Exp(b)

95% CI for Exp(b)

Lower Upper

AGE -0.078 0.037 4.399 1 0.036 0.925 0.860 0.995

FEMALE 1.597 0.756 4.470 1 0.034 4.940 1.124 21.716

Constant 1.633 1.110 2.164 1 0.141 5.120

logit(P)= 1,633 –0,078AGE + 1,597FEMALE

logit(P)= 1,633 –0,078AGE ... mužilogit(P)= 3,230 –0,078AGE ... ženy

Logistická regrese

Interpretace

• Pro jakýkoli daný věk je šance přežití pro ženy 4,9 krát větší než pro muže (e1,597=4,94); 95% CI: (1,1; 21,6)

Šance přežití 40letého vzhledem k 20letému

• Odhad β1 je –0.078; e-0.078=0.925 je poměr šancí pro jednotkovou změnu věku

• e-0,078*20=0,21 je poměr šancí pro změnu o 20 let

Logistická regrese

• 10-leté riziko úmrtí pro kardiovaskulární příčiny

• pro 62letého muže, nediabetika, který kouří 20 cigaret denně, má BMI 25 kg/m2, STK 140 mm Hg, cholesterol 245 mg/100 ml a puls 80/min je riziko 26.8 %

• pro nekuřáka (s ostatními parametry stejnými) je riziko 18.8%

-9.194Age (years) 0.104Gender (men=1; women=0) 0.658Body mass index (kg/m2) -0.041Systolic blood pressure (mm Hg) 0.007Serum cholesterol (mg/100 ml) 0.001Diabetes mellitus (yes=1; no=0) 1.251Smoking cigarettes (number per day) 0.023Heart rate beats (per min) 0.0053

)8x87x76x65x54x43x32x21x1(e1

1P +++++++++= -

Příklad - predikce

• Umožňuje současně adjustovat na vliv více proměnných, které mohou být binární, kategoriálníi spojité

• Závisle proměnná musí být binární

• Zobecnění na kategoriální závisle proměnnou model poměrných šancí (proportional odds model)

Logistická regrese

• Expozice ve více kategoriích

• Test trendu (Armitage)

Další možnosti

TEST TRENDUkonzumace alkoholu a rakovina jícnu

Alkohol (g/den)

Případy Kontroly CELKEM RR Podíl

0-39 29 386 415 1,00 6,99

40-79 75 280 355 3,57 21,13

80-119 51 87 138 7,80 36,96

120+ 45 22 67 27,23 67,16

CELKEM 200 775 975

•χ2 nezávislost: 158,8; DF=3–χ2 linearita: 6,9; DF=2–χ2 trend: 151,9; DF=1 ; P<0,001

(Breslow, Day: Statistical Methods in Cancer Research I, 1980)

• Nulová hypotéza H0 („nic se neděje“)

• Alternativní hypotéza HA (co se děje, když H0 neplatí)

• Statistický test říká, zda zamítneme H0 nebo nezamítneme

• Nezamítnutí není totéž, co přijetí hypotézy

Hypotézy

Skutečnost

Rozhodnutí na základě výběru

Nezamítáme H0 Zamítáme H0

(statist. významný výsledek)

H0 platíSprávné rozhodnutí

P=1-α (hladina spolehlivosti)

Chyba I. druhu

P= α (hladina významnosti)

H0 neplatí,

platí HA

Chyba II. druhu

P=β

Správné rozhodnutí

P=1- β (síla testu)

MOŽNÉ VÝSLEDKY STATISTICKÉHO TESTU A TYPY CHYB

ROZSAH VÝBĚRU (DLE POŽADAVKU NA OR)

• Armitage P., Berry G.: Statistical Methods in Medical Research. 2nd ed., Blackwell Scientific Publications, Oxford, 1991

• Armitage P., Colton T., eds.: Encyclopedia of Biostatistics. Wiley, Chichester, 1998• Breslow N.E., Day N.E.: Statistical Methods in Cancer Research. Vol. 1 - The analysis of case-

control studies. IARC Scientific Publications No. 32. International Agency for Research on Cancer, Lyon, 1980

• Breslow N.E., Day N.E.: Statistical Methods in Cancer Research. Vol. 2 - The Design and Analysis of Cohort Studies. IARC Scientific Publications No. 82. International Agency for Research on Cancer, Lyon, 1987

• Henneckens C.H., Buring J.: Epidemiology in Medicine. Little, Brown and Company, Boston, 1987• Jewell, N.P.: Statistics for Epidemiology. Chapman&Hall/CRC, Boca Raton, 2004• Newman, S.C.: Biostatistical Methods in Epidemiology. Wiley, New York, 2001• Rothman, K., Greenland, S.: Modern Epidemiology. 2nd ed. Lippincott-Raven, Philadelphia, 1998• Sachs, L.: Applied Statistics. A Handbook of Techniques. Springer-Verlag, New York, 1982• dos Santos Silva I.: Cancer Epidemiology: Principles and Methods. International Agency for

Research on Cancer, Lyon, 1999• Woodward, M.: Epidemiology. Study Design and Data Analysis. 2nd ed. Chapman&Hall/CRC, Boca

Raton, 2005• Zvárová, J., Malý, M. (ed.): Biomedicínská statistika III. Statistické metody v epidemiologii, svazek

1 a 2. Karolinum, Praha, 2003

Literatura