ANÁLISE DE SOBREVIVÊNCIA...O que é a análise de sobrevivência ? A análise de sobrevivência é...

31
ANÁLISE DE SOBREVIVÊNCIA M Eduarda D. S. Matos Coimbra, 19 de Abril de 2010

Transcript of ANÁLISE DE SOBREVIVÊNCIA...O que é a análise de sobrevivência ? A análise de sobrevivência é...

ANÁLISE DE SOBREVIVÊNCIA

M Eduarda D. S. Matos

Coimbra, 19 de Abril de 2010

O que é a análise de sobrevivência ?

A análise de sobrevivência é um conjunto de processo s estatísticos, utilizados na análise dos dados, para a qual a variável de interesse é o t empo que decorre até que um acontecimento se verifique.

O tempo pode ser analisado em anos, meses, semanas ou dias , desde o início do “follow-up” até que o acontecimento ocorra

Por acontecimento , significamos morte, incidência da doença, recaída / remissão, cura, ou qualquer experiência de interesse que pode acontece r a uma pessoa (por ex. regresso ao trabalho)

Calcula-se o tempo de sobrevivência iniciando-o num ponto de partida natural para o estudo (ex: data da cirurgia ou diagnóstico de uma doença) até ao ponto em que o doente alcança o limite de interesse.

Exemplos:• Doentes com leucemia/ tempo em remissão (semanas)• Coorte livre de doença/ tempo até ocorrer um enfarte• População idosa (60+) / tempo até à morte• Transplantes de coração/ tempo até à morte (meses)

EXEMPLO DE DADOS TRUNCADOS OU CENSURADOS

Os doentes de um ensaio de um novo medicamento para a infecção de HIV podem permanecer sem SIDA até à conclusão do estudo. Isto pode dever-se ao facto do ensaio acabar num momento em que ainda não tinham contraído SIDA, ou porque se retiraram estes indivíduos do estudo a ntes de contraírem a doença, ou ainda porque morreram por causas não ligadas à SI DA, antes do final do estudo.

Há geralmente três razões para isto acontecer:

�O acontecimento não se dá antes do fim do estudo�A pessoa não é seguida até ao fim�A pessoa não continua no estudo porque por exemplo morre (a morte não é o que se está a analisar).

Na maioria das análises existem dados truncados ou censurados (censored), quando temos informação acerca do tempo de sobreviv ência, mas não temos o tempo de sobrevivência exacto, ou seja o doente dur ante o estudo não alcançou o limite de interesse.

Objectivos da análise de sobrevivência

� Estimar e interpretar sobrevivência e/ou funções de risco (hazard) de dados de sobrevivência

� Comparar funções de sobrevivência e/ou de risco

� Avaliar a relação das variáveis explicativas (exploratórias) com o tempo de sobrevivência

REPRESENTAÇÃO DE DADOS DE SOBREVIVÊNCIA

Pode ser desenhada uma linha horizontal para cada doente, sendo o seu comprimento o tempo de sobrevivência. Desenham-se a s linhas da esquerda para a direita e é possível distinguir-se os doentes que alcançam o limite dos que são censurados, através de diferentes símbolos no final da linha. Contudo, estes gráficos não resumem os dados e é difícil obter-se um significado da sobrevivência global.

As curvas de sobrevivência são geralmente calculada s pelo método de Kaplan-Meier

Quando se desconhece o tempo exacto de sobrevivênci a, calculam-se as probabilidades de sobrevivência, através do método actuarial.

Muitas vezes, traduz-se a sobrevivência referindo-s e às probabilidades de sobrevivência (com intervalos de confiança) em determinados pontos temporais na curva , tal como por exemplo, as taxas de sobrevivência aos 5 anos , em doentes pós tratamento ao cancro da mama. Em altern ativa, pode indicar-se a mediana do tempo de sobrevivência (o tempo em que 50% dos indivíduos fizeram progressos).

Pode-se pretender verificar o impacto de inúmeros f actores de interesse na sobrevivência, tal como por exemplo, o tratamento e a gravidade da doença.

Assim podem representar-se as curvas de sobrevivênc ia, de forma separada, para subgrupos de doentes; estas fornecem um meio de se verificar visualmente se os diferentes grupos de doentes alcançam o limite a ta xas diferentes.

Exemplo:Acontecimento X: morte

•O indivíduo A, por exemplo é seguido desde o início do estudo até ter ocorrido o acontecimento de interesse na 5ª semana; o tempo de sobrevivência foi de 5 semanas e não é truncado

•O indivíduo B também é observado no início do estudo mas é seguido até ao fim das 12 semanas de estudo sem se ter verificado o ac ontecimento (morte); o tempo de sobrevivência é truncado, porque apenas pod emos dizer que esteve vivo 12 semanas.

•O indivíduo C entra no estudo entre a 2ª e a 3ª semana, e é seguido até ter desaparecido à 6ª semana; o tempo de sobrevivência é t runcado em 3,5 semanas.

•O indivíduo D entra na 4ª semana, e é seguido até ao fim do estudo s em se verificar o acontecimento; o tempo de sobrevivência truncado é de 8 semanas.

•O indivíduo E entra no estudo na 3ª semana e é seguida até à 9ª semana , em que é perdido de vista; o seu tempo de sobrevivência tru ncado é de 6 semanas.

•O indivíduo F entra na 8ª semana e é seguido até que decorre o acont ecimento àsemana 11,5. Tal como o indivíduo A não é truncado, o tempo de sobrevivência éde 3,5 semanas.

Assim obteríamos a seguinte tabela

13,5F

06E

08D

03,5C

012B

15A

Morto (1)

Truncado

(0)

Tempo de

sobrevivência

Indivíduo

ID data do diagnostico morte mês da morte última observação follow-up

1 2005/01 1 2005/07 6 2 2005/04 1 2005/09 5 3 2005/03 0 2005/10 7 4 2005/05 0 2005/10 5 5 2005/02 0 2005/08 6

FUNÇÃO OU DISTRIBUIÇÃO DE SOBREVIVÊNCIA- É uma função cronológica habitualmente designada pela letra S(t) , que se inicia num determinado momento no tempo, com 100% da população ainda viva e com sa úde e nos permite calcular qual a percentagem dessa população ainda viva e com saúde noutros momentos ao longo do tempo.

Outro exemplo

DADOS COMPLETOS

O tempo de sobrevivência de 10 doentes é o seguinte

1, 2, 2, 4, 5, 7, 11, 16, 20, 33

1.Construa a tabela pelo método intuitivo.

0,001133

0,111220

0,221316

0,331411

0,44157

0,55165

0,66174

0,77292

0,991101

Si (si/N)s

idi

ni

ti

O tempo de sobrevivência mediano é de 5 meses ou se ja 50% dos doentes têm um tempo de sobrevivência de 5 meses.

2. Construa a tabela de sobrevivência pelo método prod uto-limite ( Kaplan-Meier ).n1=N n i+1= n i-d i

t0=0 e S0=1

0,00/11/11133

0,11/21/21220

0,22/31/31316

0,33/41/41411

0,44/51/5157

0,55/61/6165

7/10*6/7=6/10=0,66/71/7174

9/10*7/9=7/10=0,77/92/9292

1*9/10=0,99/101/101101

Si =

Si-1 pi

pi=1- q

iqi

di

ni

ti

t i - momento no tempon i – nº de sobreviventes até ao momento t id i – nº de mortos no instante t iw i – nº de censurados no instante t iq i- probabilidade de morrer no instante t ip i – probabilidade de sobreviver no instante t is i – nº de sobreviventes no instante t iSi– Sobrevivência cumulativa (probabilidade de sobrevi ver ao ao instante t i

)

• As curvas de sobrevivência geralmente calculadas pe lo método de KaplanMeier, representam a probabilidade cumulativa (a probabilidade de sobrevivência) de um indivíduo permanecer livre de doença (acontec imento) em qualquer momento posterior à altura base .

• A probabilidade de sobrevivência apenas se altera quando ocorre o acontecimento em estudo , sendo a curva resultante numa série de segmentos (curva em escada).

•Assim o modelo de Kaplan Meier baseia-se na estimativa das probabilidades condicionais , da taxa de sobrevivência em cada ponto no tempo.

• Um dos pressupostos para a realização das tabelas de sobrevivência pelo método produto-limite de Kaplan Meier é que os indivíduos em que os dados são incompletos têm o mesmo risco que os indivíduos em que o acontecimento se verificou.

A sobrevivência no final de cada intervalo é igual ao produto da sobrevivência cumulativa até ao final do intervalo anterior pela s obrevivência condicional nesse intervalo

Exemplo 1 – dados completosO tempo de aleitamento, isto é o tempo decorrido desde o nascimento até ao desmame, pode ser considerado como uma variável tempo de sobrevivência Suponha que o tempo até ao desmame, em meses, tenha sido registado para 15 crianças:12 10 3 5 1 6 8 1 5 2 2 5 8 1 Considerando que não se verificou censura:

Represente os tempos de observação das 15 crianças

Como representaria uma base de dados para analisar estes dados?

1115

1814

1513

1212

1211

1510

119

188

167

116

155

134

1103

1122

161

statustempoCriança

Construa a tabela de Kaplan- Meier

0,0667*0=0,00001-01/11112

0,1333*0,5=0,06671-1/2=0,51/21210

0,2667*0,5=0,13331-2/4=0,52/4248

0,4*0,6667=0,26671-2/6=0,66672/6266

0,6000*0,6667=0,41-3/9=0,66673/9395

0,6667*0,9=0,60001-1/10=0,91/101103

0,8*0,833=0,66671-2/12=0,8332/122122

0,81-3/15=0,83/153151

Si=Si-1pipi=1- qiqi= di/ nidiniti

Represente a curva de Kaplan Meier

Com base na tabela que criou , responda

Qual a probabilidade de uma criança ser amamentada pelo menos até ao sexto mês de vida?

S(6) =0,2667

Qual a probabilidade de ser amamentada por mais de 3 meses?S(3)=0,6

Qual a probabilidade de ser amamentada por mais de 10 meses?

S(10)=0,0667

Qual foi o tempo mediano de aleitamento?

O tempo mediano de aleitamento está entre 3 e 5 meses

EXEMPLO 2- Dados censurados

A tabela anexa representa o tempo de sobrevivência de 10 doentes

1+, 3, 4+, 5, 5, 6+, 7, 7, 7+, 8+ (+) dados inc ompletos

Construa a tabela de sobrevivência pelo método prod uto-limite (Kaplan-Meier)

0,31710/11018

0,317½2/41247

0,63510/51056

0,6355/72/70275

0,88910/81084

0,8898/91/90193

110/1010101

Si

pi

qi

wi

di

ni

ti

O output do software estatístico SPSS é o seguinteKaplan-Meier

Time Status Cumulative Standard Cumulative NumberSurvival Error Events Remainin g

1 ,00 0 93 1,00 ,8889 ,1048 1 84 ,00 1 75 1,00 2 6 5 1,00 ,6349 ,1692 3 56 ,00 3 47 1,00 4 37 1,00 ,3175 ,1799 5 27 ,00 5 18 ,00 5 0

Number of Cases: 10 Censored: 5 ( 50 ,00%) Events: 5

Survival Time Standard Error 95% Confidence In tervalMean: 6 1 ( 5; 7 )

Median: 7 1 ( 5; 9 )

t i - momento no tempon i – nº de sobreviventes até ao momento t id i – nº de mortos no instante t iw i – nº de censurados no instante t iq i- probabilidade de morrer no instante t ip i – probabilidade de sobreviver no instante t iSi– Sobrevivência cumulativa

CURVA DE KAPLAN-MEIER

TEMPO DE SOBREVIVÊNCIA (MESES)

1086420

SO

BR

EV

IVÊ

NC

IA C

UM

ULA

TIV

A

1,0

,9

,8

,7

,6

,5

,4

,3

,2

,1

0,0

EXERCÍCIO 1Os dados seguintes apresentados de acordo com o sex o relativos ao tempo de sobrevivência (em semanas) de 42 doentes com leucem ia, retirados de um estudo clínico que pretendia comparar tratamento co m placebo.Preencha os espaços vazios da tabela de sobrevivênc ia obtida pelo método produto limite só para o sexo masculino e represente a curva de Kaplan Meier

Sexo masculino:35+, 34+, 32+, 32+, 25+, 23, 22, 20+, 16, 6, 23, 8, 5, 4, 4, 3, 2, 2, 1, 1

Sexo feminino:19+, 17+, 13, 11, 10+, 10, 9+, 7, 6+, 6, 6, 22, 17, 15, 12, 12, 11, 11, 8, 8, 8, 5

EXERCÍCIO 1

0,800,900,89 =×

1010135

1010234

1020432

1010525

0,7140,28602723

0,3940,8750,12501822

0,451010920

0,450,9000,100011016

0,500,9090,09101118

0,550,9170,08301126

0,600,9230,0770113

0,650,8670,13302154

0,9370,06201163

0,890,11102182

0,900,902/20=0,1002201

Sipiqiwidiniti

MÉTODO ACTUARIAL (CUTLER-EDERER )

Pode-se utilizar um método alternativo de cálculo das probabilidades de sobrevivência, mediante uma abordagem da tabela da vida, quando o tempo para se alcançar o limite apenas se conhece num determin ado intervalo de tempo (ex: no espaço de um ano).

Um dos pressupostos para a realização das tabelas d e sobrevivência é que os censurados durante um dado intervalo ocorram aleato riamente nesse intervalo.

EXEMPLO 3Os dados que se seguem representam o tempo de sobre vivência (em meses) de 63 doentes com linfoma de Hodgkin, separados em dois grupos ( A-assintomáticos; B- com febre ou sudação ou emagrecim ento superior a 10%).

GRUPO A 3.1+, 4.4+, 6.2, 9.0, 9.9, 14.4, 15.8, 18.5, 27.6+, 28.5, 30.1+, 31.5+, 32.2+, 41.0, 41.8+, 44.5+, 50.6+, 54.3+, 55.0, 60.0+, 60.4+, 63.6+, 63.7+, 63.8+, 66.1+, 68.0+, 68.7+, 68.8+, 70.9+, 71.5+, 74.8+, 75.3+, 75.7+

GRUPO B2.5, 4.1, 4.6, 6.4, 6.7, 7.4, 7.6, 7.7, 8.8, 13.3, 13.4, 18.3, 19.7, 21.9, 24.7, 27.5, 29.7, 30.1+, 32.9, 33.5, 35.4+, 37.7+, 40.9+, 42.6+, 45.4+, 48.5+, 48.9+, 60.4+, 64.4+, 66.4+

Construa a tabela de sobrevivência pelo método actu arial só para o grupo A

Tabela de sobrevivência dos 33 doentes com linfoma d e Hodgkin assintomáticos (método actuarial)

0,6831000078+

0,6871030372-78

0,6871060966-72

0,68710501460-66

0,6870,9360,064111654-60

0,73410101748-54

0,73410101842-48

0,7340,9490,051112036-42

0,77310302330-36

0,7730,9590,041112524-30

0,8060,9620,038012620-24

0,8390,9290,071022812-18

0,9030,9030,09703316-12

11020330-6

SipiqiwidIniti

Em que w/2n

dq

−=

,09,361,00,000,5001166,000

,09,361,00,0002,0002360,000

,09,361,00,0003,0000354,000

,09,361,00,0004,0002548,000

,09,361,00,0006,0002742,000

,09,361,00,0008,0002936,000

,09,36,83,17212,00021330,000

,09,43,81,19316,00001624,000

,09,53,84,16319,00001918,000

,09,63,90,10221,00002112,000

,08,70,78,22627,0000276,000

,05,90,90,10330,000030,000

Std. Error of Cumulative Proportion

Surviving at End of Interval

Cumulative Proportion

Surviving at End of Interval

ProportionSurviving

ProportionTerminating

Numberof

Terminal Events

NumberExposed to

Risk

NumberWithdrawing

duringInterval

NumberEnteringInterval

Interval StartTime

Sendo o output

COMPARAÇÃO DE CURVAS DE SOBREVIVÊNCIA

Como se pode avaliar se duas ou mais curvas são est atisticamenteequivalentes?O teste mais utilizado é designado por teste de log-rank.

Quando dizemos que duas curvas de Kaplan Meier não sã o estatisticamente significativas, queremos dizer , baseados no teste , que compara as duas curvas na globalidade, que não temos evidência para indica r que as curvas de sobrevivência reais (população) são diferentes.

No exemplo dos doentes com linfoma de Hodgkin (exempl o 2) fomos comparar as curvas de sobrevivência dos dois grupos A e B.

Pelo teste de log rank (estatístico=3,18, gl=1 p=0,07 ), p>0,05, concluindo-se que as curvas não diferem significativamente, isto é são equivalentes.

Teste de Log- rank Χ2 =2

222

1

211 )()(

E

EO

E

EO −+−

)mm(*)nn

n(e jj

jj

j

j 21

21

1

1 ++

=

)mm(*)nn

n(e jj

jj

j

j 21

21

2

2 ++

=

H0: não há diferença entre as curvas de sobrevivência

A estatística de Log- rank segue uma distribuição do Quiquadrado com 1 grau de liberdade segundo H 0

jj

j

nn

n

21

1

+Proporção em risco do grupo 1 no total

jj mm 21 + Nº de mortes nos dois grupos

No caso de apenas dois grupos

LINFOMA DE HODGIN

MÉTODO PRODUTO LIMITE DE KAPLAN MEIER

Tem po de sobrevivência (m eses)

78 72 66 60 54 48 42 36 30 24 18 12 6 0

Si

1,0

,9

,8

,7

,6

,5

,4

,3

,2

,1

0,0

B

A

EXERCÍCIO 2Complete a tabela de sobrevivência para os doentes c om leucemia pertencentes ao grupo B, segundo o método actuarial .

1010166-72

1020360-66

1000354-60

10205

1020742-48

1020936-42

0,3610,8330,167221330-36

0,4330,8130,187031624-30

0,8420,158031918-24

0,6330,9050,09520221

0,7000,7780,22206276-12

0,90,90,103300-6

Sipiqiwidiniti

BIBLIOGRAFIA

• Basic and Clinical Biostatistics. Chap 11 Beth Dawson-Saunders and Robert G. Trapp1990, Prentice-Hall International Inc

• Survival AnalysisDavid G. Kleinbaum1996 Springer-Verlag New-York,Inc