Post on 21-Jan-2019
Análise de Sobrevida
Tania Guillén de TorresRejane Sobrino Pinheiro
Universidade Federal do Rio de JaneiroNESC- Mestrado em Epidemiologia e BioestatísticaDisciplina: Análise de Regressão em Saúde
Análise de sobrevidaDefinições:
� Tipo de estudo � estudos de coorte ou ensaios clínicos
� Variável resposta � tempo transcorrido entre a entrada do indivíduo no estudo e a ocorrência de um evento a ser relacionado com a exposição ou tratamento.
� Evento (falha ) � pode ser doença, morte, cura etc.
� Tempo de sobrevida:
� Medido para cada indivíduo, desde sua entrada no estudo até a ocorrência do "evento" (falha).
� Indivíduos podem entrar no estudo em qualquer período durante o tempo do estudo.
� Tempo pode ser medido em qualquer unidade
� dias, semanas, meses, etc.
Análise de sobrevida
� Tempo até a ocorrência do evento
� Métodos especiais de análise
� Distribuição dos tempos não é gaussiana
� Dados com censura
Nesta seção serão apresentadas técnicas de analise de tempos de sobrevida para o caso de um único desfecho de interesse.
Exemplos de aplicação:
� Tempo de remissão, em semanas, para pacientes com Leucemia.
� Tempo, em anos, até a ocorrência de doença coronariana, numa corte de indivíduos sem doença.
� Tempo, em anos, até a morte numa população de idosos (>60 anos)
� Tempo (meses) até morte em pacientes transplantados.
Observação:
É possível avaliar simultaneamente a ocorrência de vários desfechos num único desenho de estudo, por exemplo mortes por Câncer em mulheres (Ca. de colo uterino, Ca. Mama, etc.). Podem ser abordados como um problema de Riscos Competitivos, porem este tópico não faz parte da disciplina.
Dado censurado:
� Indivíduo não sofre o "evento" durante o período de estudo, de modo que o tempo exato de sobrevida não é conhecido.
� Censura devida a:
� O indivíduo não experimenta o evento antes do fim do estudo (estudo termina antes da ocorrência do evento)
� Perda defollow-up (seguimento) durante o período do estudo
� Saída do estudo por causa de óbito (por outra causa), ou por outra razão (reação adversa à droga)
� Indivíduos podem entrar no estudo em qualquer instante depois do início do estudo e pode ser censurado em qualquer instante de tempo durante o estudo.
Pacientes de Leucemia em remissão
�Início doestudo
Fim doestudo
××××
Censura
Tempo de sobrevida censurado, observado no estudo
Tempo de sobrevida verdadeiro
Dados censurados Exemplo: Leucemia
� Comparar os tempos de remissão, de um grupo de pacientes com leucemia tratados com a droga 6-mercaptopurine com os tempos de remissão de um grupo controle não tratado.
� Desfecho (evento) � recidiva (recaída)
� Tempo de sobrevida � número de semanas em remissão
Grupo controle:
1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23
Grupo tratado:
6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*
* = follow-up incompleto (censura)
Interpretação:6* � indivíduo ainda em remissão
depois de 6 semanas no estudo, e não observado após este tempo.
6 � indivíduos conhecidos como em remissão por 6 semanas, mas tiveram recaída entre a 6a. e a 7a. semanas.
Observar:� Nenhuma censura no grupo
controle (todos "falharam")� Parece que o tempo de sobrevida
é maior para os do grupo tratado
Grupo tratado:
6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*
1: Controle 2:TratamentoObs Tempo recidiva Grupo Obs Tempo recidiva Grupo
1 1 1 1 22 6 0 22 1 1 1 23 6 1 23 2 1 1 24 6 1 24 2 1 1 25 6 1 25 3 1 1 26 7 1 26 4 1 1 27 9 0 27 4 1 1 28 10 0 28 5 1 1 29 10 1 29 5 1 1 30 11 0 2
10 8 1 1 31 13 1 211 8 1 1 32 16 1 212 8 1 1 33 17 0 213 8 1 1 34 19 0 214 11 1 1 35 20 0 215 11 1 1 36 22 1 216 12 1 1 37 23 1 217 12 1 1 38 25 0 218 15 1 1 39 32 0 219 17 1 1 40 32 0 220 22 1 1 41 34 0 221 23 1 1 42 35 0 2
Como comparar os tempos:
� Média ou mediana do tempo de remissão para cada grupo, ignorando a condição de censura ( ttrt = 17,1 e tcontrole= 8,7 )
Problema: tempos censurados podem enviesar os resultados
Alternativas:
1. Excluir tempos censurados
� Tempo de sobrevida pelo tratamento muito baixo, por excluir os tempos de remissão mais longos (subestimar).
2. Incluir tempos censurados
� Ignorar a diferença entre evento e censura. Indivíduos com os tempos de sobrevida censurados tem atualmente tempos de sobrevida maiores do que as semanas representadas no estudo
Stata:
1 – Abrir o banco
File � Open.. � diretório � banco. use “C:\Data\leucemia.dta"
. desc
Contains data from E:\Regressao\Sobrevida\AulaPratica\ Bancos\leucemia.dtaobs: 42
vars: 4 11 Nov 2009 10:20size: 336 (99.9% of memory free)
--------------------------------------------------- --------------------------storage display value
variable name type format label varia ble label--------------------------------------------------- --------------------------obs byte %8.0g Obstempo byte %8.0g Tempo ate a recaidarecidiva byte %8.0g recidiva Retor no da doencagrupo byte %8.0g grp Grupos de com paracao--------------------------------------------------- --------------------------Sorted by:
2 - Declarar um banco para Análise de Sobrevida
Statistics���� Survival analysis ���� Setups & utilities���� Declare data to be survival-time data
Stata:
Comando “stset vartempo varcensura”
���� Declara o banco como sendo um banco com tempos de s obrevida
Stata:
. stset tempo, failure(recidiva==1)
failure event: recidiva == 1obs. time interval: (0, tempo]
exit on or before: failure
--------------------------------------------------- ---------------------------42 total obs.
0 exclusions--------------------------------------------------- ---------------------------
42 obs. remaining, representing30 failures in single record/single failure data
541 total analysis time at risk, at risk from t = 0earliest observed entry t = 0
last observed exit t = 35
Função de sobrevida:
T � variável aleatória � tempo de sobrevida de um indivíduot � qualquer valor de interesse para a variável aleatória T
Ex: Se estamos interessados em avaliar se uma pessoa sobrevive mais de 5 anos após submeter-se a tratamento para câncer
A função de sobrevida dá a probabilidade de uma pessoa viver mais do que um tempo específico t = 5.
Isto é, S(T) dá a probabilidade de um indivíduo sobreviver além do tempo t (probabilidade de uma variável aleatória T exceder um determinado valor especificado (t).
S(t) = P(T > t)
S(5) = P(T > 5)
Teoricamente, como t varia de 0 a ∞, a função de sobrevida decai.
Se não houver censura:
A função é decrescente, ou seja, os valores de S(t) decrescem à medida que t cresce.
Para t = 0 � S(t) = = S(0) = 1
Para t = ∞ � S(t) = 0
0 ≤ S(t) ≤ 1
indivíduos de totalN
tque do mais amsobreviver que indivíduos de N)(
°°=tS
0 ∞
S(t)
1
Sempredecrescente
Grupo controle (nenhuma censura):
1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23
381.0218
)10( ==S
N° sobreviventes além de 10 semanas
Probabilidade de sobrevida além de 10 semanas
N° total de indivíduos
048.021
1)22( ==S
N° sobreviventes além de 22 semanas
Probabilidade de sobrevida além de 22 semanas
N° total de indivíduos
Probabilidade de sobrevida para o grupo controle:
t: 1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23mt = n° de falhas no instante t.
n tinstante no tessobreviven de N
)(°=tS
t m t m t a cum u la d a S ( t ) 0 0 0 (2 1 -0 ) /2 1 = 2 1 /2 1 = 1 .0 0 1 2 2 (2 1 -2 ) /2 1 = 1 9 /2 1 = 0 .9 1 2 2 4 (2 1 -4 ) /2 1 = 1 7 /2 1 = 0 .8 1 3 1 5 (2 1 -5 ) /2 1 = 1 6 /2 1 = 0 .7 6 4 2 7 (2 1 -7 ) /2 1 = 1 4 /2 1 = 0 .6 7 5 2 9 (2 1 -9 ) /2 1 = 1 2 /2 1 = 0 .5 7 8 4 1 3 (2 1 -1 3 ) /2 1 = 8 /2 1 = 0 .3 8
1 1 2 1 5 (2 1 -1 5 ) /2 1 = 6 /2 1 = 0 .2 9 1 2 2 1 7 (2 1 -1 7 ) /2 1 = 4 /2 1 = 0 .1 9 1 5 1 1 8 (2 1 -1 8 ) /2 1 = 3 /2 1 = 0 .1 4 1 7 1 1 9 (2 1 -1 9 ) /2 1 = 2 /2 1 = 0 .1 0 2 2 1 2 0 (2 1 -2 0 ) /2 1 = 1 /2 1 = 0 .0 5 2 3 1 2 1 (2 1 -2 1 ) /2 1 = 0 /2 1 = 0 .0 0
t: 1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23
21S1
(19)
D1(2)
P(S1)=19/21
P(D1)=2/21
S2(17)
D2(2)
17/19
2/19
S3(16)
D3(1)
16/17
1/17
S4(15)
D4(2)
14/16
2/16
•••
0.67 21
14
16
14
17
16
19
17
21
19 S(4)
0.76 21
16
17
16
19
17
21
19 S(3)
0.8121
17
19
17
21
19 S(2)
0.91 21
19
21
191 S(1)
1.00 21
0-21 S(0)
==×××=
==××=
==×=
==×=
==
P(S4) = P(S1)×P(S2| S1)×P(S3| S2∩ S1) ×P(S4| S1∩ S2∩ S3)
Probabilidade de sobrevida para o grupo controle:
P(S2| S1)
Curva de sobrevida:
É a representação gráfica da Função de sobrevida S(t) no eixo vertical vs. os tempos de sobrevida (t) no eixo horizontal
0.00
0.25
0.50
0.75
1.00
0 5 10 15 20 25analysis time
Kaplan-Meier survival estimateS(t)
(t)
Função de Hazard (risco)� Densidade instantânea de incidência
Taxa de falha condicional
� Taxa de falha instantânea (falha durante um intervalo de tempo
bem pequeno de amplitude ∆t, dado que um indivíduo tenha
sobrevivido até o início do intervalo) / ∆t).
Função de Hazard:
tinstante no tessobreviven Nº
t)t(t, intervalo no tempode unidadepor morreram que indivíduos de Nº)(
∆+=th
t
tTttTtPth
t ∆>∆+<<=
→∆
]|)([lim)(
0
Risco instantâneo
Exemplo:
h(t) para dados de leucemia (grupo tratado), com ∆t = 1
6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*
143.0213
)6( ==h
n° de recidivas no instante de tempo 6
n° sob risco no início do intervalo de tempo 6
059.0171
)7( ==h
n° de recidivas no instante de tempo 7
n° sob risco no início do intervalo de tempo 7
Stata:
Statistics ���� Survival analysis ���� Summary statistics, test, & tables ���� Summarize survival-time data
. stsum
failure _d: recidiva == 1analysis time _t: tempo
| incidence no. of |------ Survival time ---- -|| time at risk rate subjects 25% 50% 75%
---------+----------------------------------------- ----------------------------total | 541 .0554529 42 6 12 23
. stsum, by(trtment)
failure _d: relapse == 1analysis time _t: weeks
| incidence no. of |------ Survival time ---- -|trtment | time at risk rate subjects 25% 50% 75%---------+----------------------------------------- ----------------------------
0:stand | 182 .1153846 21 4 8 121:trt | 359 .0250696 21 13 23 .
---------+----------------------------------------- ----------------------------total | 541 .0554529 42 6 12 23
Calcular o hazard - Risco instantâneo dos tempos Função de Hazard acumuladaGraphics ���� Survival analysis graphs
���� Survivor & cumulative hazard functions
. sts graph failure _d: relapse == 0 1analysis time _t: weeks
. sts graph, by( trtment)failure _d: relapse == 0 1analysis time _t: weeks
0.00
0.25
0.50
0.75
1.00
0 10 20 30 40analysis time
Kaplan-Meier survival estimate
0.00
0.25
0.50
0.75
1.00
0 10 20 30 40analysis time
trtment = 0:stand trtment = 1:trt
Kaplan-Meier survival estimates, by trtment
Função de Hazard acumuladaGraphics ���� Survival analysis graphs
���� Survivor & cumulative hazard functions
Função de Hazard acumulada
. sts graph, by(grupo) na
failure _d: recidiva == 1analysis time _t: tempo
0.0
01.
00
2.0
03.
00
4.0
0
0 10 20 30 40analysis time
grupo = Controle grupo = Tratamento
Nelson-Aalen cumulative hazard estimates, by grupo
Função de sobrevida - dados censurados
S(t) pode ser derivada de uma função h(t) para dados censurados
S(0) = 1 - h(0)S(1) = [1-h(0)] x [1 - h(1)]S(2) = [1-h(0)] x [1 - h(1)] x [1 - h(2)]
S(t) = [1-h(0)] x [1 - h(1)] x ... x [1 - h(t)]
Ou:
S(0) = 1 - h(0)S(1) = S(0) x [1 - h(1)]S(2) = S(1) x [1 - h(2)]S(3) = S(2) x [1 - h(3)]
S(t) = S(t-1) x [1 - h(t)]
d6(3)
C6(1)
S6(17)
21d7(1)
C7(0)
S7(16)
d10(1)
C10(2)
S10(13) ���
P(S7| S6)
16/17
3/21
1/17
1/16
Função de sobrevida - dados censurados
0.806 )17
1-(1 )
21
31(1 S(7)
0.86 )21
31(1 S(6)
1.00 21
0-21 S(0)
=×−×=
=−×=
==
Exemplo:Grupo tratado: 6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35*
[1-2) = 1 semana a < 2 semanasnt = sob risco; mt = recidivas; qt = censuradoSomente tem-se que calcular S(t) p/ valores de t onde 1 ou + falhas ocorram (mt).
t j nj mj qj H(t) = mt S(t) = S(t-1) x [1 – h(t)] [0-1) 21 0 0 0 / 21 = .000 1.0 x [ 1 – 0] = 1.00 [1-2) 21 0 0 0 / 21 = .000 1.0 x [ 1 – 0] = 1.00 [6-7) 21 3 1 3 / 21 = .143 1.0 x [ 1 – 0.143] = 0.857 [7-8) 17 1 0 1 / 17 = .059 .857 x [1 - .059] = .806 [8-9) 16 0 0 0 / 16 = .000 .806 x [1 – 0] = .806 [9-10) 16 0 1 0 / 16 = .000 .806 x [1 – 0] = .806 [10-11) 15 1 1 1 / 15 = .067 .806 x [1 – 0.067] = .752 [13-14) 12 1 0 1 / 12 = .083 .752 x [1 - .083] = .690 [16-17) 11 1 0 1 / 11 = .091 .690 x [1 - .091] = .627 [22-23) 7 1 0 1 / 7 = .143 .627 x [1 - .143] = .537 [23-24) 6 1 0 1 / 6 = .167 .537 x [1 - .167] = .447 [24-25) 5 0 0 0 / 5 = .000 .447 x [1 – 0] = .447 [35-36) 1 0 1 0 / 1 = .000 .447 x [1 – 0] = .447
0.00
0.25
0.50
0.75
1.00
0 10 20 30 40analysis time
Kaplan-Meier survival estimate
As probabilidades acumuladas de sobrevida nos períodos são:
P(S ao 1º ano) = P(S 1) = 0,87P(S ao 2º ano) = P(S 1)*P(S2/ S1) = 0,67P(S ao 3º ano) = P(S 1)*P(S2/ S1)* P(S3/ S1∩∩∩∩ S2)
= 0,60
1
0.6
0.67
0.87
0.6
0.7
0.8
0.9
1
0 1 2 3
11
0.6
0.67
0.87
0.92
0.71
0.77
0.5
0.6
0.7
0.8
0.9
1
0 1 2 3
Método de Kaplan-MeierChama-se de tabela de vidaa uma tabela de probabilidades de sobrevivência acumuladas no período estudado e de curva de sobrevida ao gráfico destas probabilidades versus o tempo de sobrevivência.
Tabelas de Vida
� Tempos de sobrevida agrupados em intervalos.
� Kaplan-Meier é uma versão modificada da tabela de vida
� KM usa tempos exatos de "falha" ou intervalos de tempo curtos
� KM tem poucos ou nenhum empate nos tempos de "falha"
Stata:
Statistics ���� Survival analysis ���� Summary statistics, test, & tables ���� Life tables for survival data
. ltable tempo recidiva, survival
Interval Total Deaths Lost Survival Error [95% Conf. Int.]1 2 42 2 0 0.9524 0.0329 0.8227 0.98792 3 40 2 0 0.9048 0.0453 0.7658 0.96313 4 38 1 0 0.8810 0.0500 0.7373 0.94864 5 37 2 0 0.8333 0.0575 0.6819 0.91685 6 35 2 0 0.7857 0.0633 0.6286 0.88226 7 33 3 1 0.7132 0.0700 0.5505 0.82587 8 29 1 0 0.6886 0.0717 0.5247 0.80598 9 28 4 0 0.5902 0.0765 0.4258 0.72219 10 24 0 1 0.5902 0.0765 0.4258 0.722110 11 23 1 1 0.5640 0.0775 0.3999 0.699111 12 21 2 1 0.5090 0.0791 0.3464 0.650412 13 18 2 0 0.4524 0.0798 0.2934 0.598713 14 16 1 0 0.4241 0.0796 0.2679 0.572115 16 15 1 0 0.3959 0.0792 0.2430 0.545016 17 14 1 0 0.3676 0.0784 0.2187 0.517417 18 13 1 1 0.3382 0.0775 0.1939 0.488419 20 11 0 1 0.3382 0.0775 0.1939 0.488420 21 10 0 1 0.3382 0.0775 0.1939 0.488422 23 9 2 0 0.2630 0.0763 0.1294 0.418023 24 7 2 0 0.1879 0.0706 0.0744 0.341025 26 5 0 1 0.1879 0.0706 0.0744 0.341032 33 4 0 2 0.1879 0.0706 0.0744 0.341034 35 2 0 1 0.1879 0.0706 0.0744 0.341035 36 1 0 1 0.1879 0.0706 0.0744 0.3410
. ltable tempo recidiva, survival by(grupo)
Beg. Std.Interval Total Deaths Lost Survival Erro r [95% Conf. Int.]
--------------------------------------------------- ----------------------------Controle
1 2 21 2 0 0.9048 0.0 641 0.6700 0.97532 3 19 2 0 0.8095 0.0 857 0.5689 0.92393 4 17 1 0 0.7619 0.0 929 0.5194 0.89334 5 16 2 0 0.6667 0.1 029 0.4254 0.82505 6 14 2 0 0.5714 0.1 080 0.3380 0.74928 9 12 4 0 0.3810 0.1 060 0.1831 0.5778
11 12 8 2 0 0.2857 0. 0986 0.1166 0.481812 13 6 2 0 0.1905 0. 0857 0.0595 0.377415 16 4 1 0 0.1429 0. 0764 0.0357 0.321217 18 3 1 0 0.0952 0. 0641 0.0163 0.261222 23 2 1 0 0.0476 0. 0465 0.0033 0.197023 24 1 1 0 0.0000 . . .
Tratamento6 7 21 3 1 0.8537 0.0 781 0.6119 0.95037 8 17 1 0 0.8034 0.0 882 0.5573 0.92139 10 16 0 1 0.8034 0.0 882 0.5573 0.9213
10 11 15 1 1 0.7480 0. 0980 0.4952 0.887011 12 13 0 1 0.7480 0. 0980 0.4952 0.887013 14 12 1 0 0.6857 0. 1078 0.4257 0.846416 17 11 1 0 0.6234 0. 1146 0.3631 0.802117 18 10 0 1 0.6234 0. 1146 0.3631 0.802119 20 9 0 1 0.6234 0. 1146 0.3631 0.802120 21 8 0 1 0.6234 0. 1146 0.3631 0.802122 23 7 1 0 0.5343 0. 1283 0.2651 0.743923 24 6 1 0 0.4453 0. 1343 0.1864 0.677325 26 5 0 1 0.4453 0. 1343 0.1864 0.677332 33 4 0 2 0.4453 0. 1343 0.1864 0.677334 35 2 0 1 0.4453 0. 1343 0.1864 0.677335 36 1 0 1 0.4453 0. 1343 0.1864 0.6773
--------------------------------------------------- ----------------------------
Teste Log Rank� Compara 2 ou mais curvas de sobrevida (H0 � as curvas são "as
mesmas")� Ordena os tempo de "falhas" dos indivíduos em 2 (ou mais)
grupos e atribui postos� O número esperado de falhas é calculado para cada intervalo para
cada grupo� Calcula um χ2 entre as falhas esperadas vs falhas observadas.� Assume intervalo de tempo pequeno (ex: 1 dia ou 1 "falha").
( ) χ 2
)1(22
2
~)(
22log−−
=−−
GEOEO
Varrankdoaestatístic
( ) ( )∑=
−=−k
jjj emEO
12222
Onde:
k = número de tempos de falha diferentesG = número de grupos diferente
G = 2 grupos
Teste Log Rank
Statistics ���� Survival analysis ���� Summary statistics, test, & tables ���� Test equality of survivor functions
Teste Log Rank
Exemplo (usando o Stata):. sts test grupo, logrank
failure _d: recidiva == 1analysis time _t: tempo
Log-rank test for equality of survivor functions
| Events Eventsgrupo | observed expected-----------+-------------------------Controle | 21 10.75Tratamento | 9 19.25-----------+-------------------------Total | 30 30.00
chi2(1) = 16.79Pr>chi2 = 0.0000
. sts test trtment, petofailure _d: relapse == 1
analysis time _t: weeks
Peto-Peto test for equality of survivor functions
| Events Events Sum oftrtment | observed expected ranks--------+--------------------------------------0:stand | 21 10.75 6.36220951:trt | 9 19.25 -6.3622095--------+--------------------------------------Total | 30 30.00 0
chi2(1) = 14.08Pr>chi2 = 0.0002
Teste Log Rank
Exemplo (usando o Stata):. sts test lgwbccat, logrank
failure _d: relapse == 1analysis time _t: weeks
Log-rank test for equality of survivor functions
| Events Eventslgwbccat | observed expected---------+-------------------------Low | 4 13.06Medium | 10 10.72:High | 16 6.21---------+-------------------------Total | 30 30.00
chi2(2) = 26.39Pr>chi2 = 0.0000
. sts test lgwbccat, peto
failure _d: relapse == 1analysis time _t: weeks
Peto-Peto test for equality of survivor functions
| Events Events Sum oflgwbccat | observed expected ranks---------+--------------------------------------Low | 4 13.06 -5.4643843Medium | 10 10.72 -1.2203977:High | 16 6.21 6.6847821---------+--------------------------------------Total | 30 30.00 0
chi2(2) = 21.37Pr>chi2 = 0.0000
0.00
0.25
0.50
0.75
1.00
0 10 20 30 40analysis time
lgwbccat = Low lgwbccat = Mediumlgwbccat = :High
Kaplan-Meier survival estimates, by lgwbccat
Exemplo:Sobrevida de mulheres com câncer cervical após a data do diagnóstico
Tabelas de vida
Função de Hazard(Método atuarial):
Estágio I:
nt = sob risco; mt = mortes ; qt = censuras
intervalo) no censuras de (No.21
tinstante no tessobreviven No.
intervalo no tempode unidadepor morrem que indivíduos de No.)(
−=th
Análise de sobrevida - Modelagem
� Como ajustar as curvas de sobrevida do grupo de tratados (expostos) para um ou mais fatores (confundidores)?
1 confundidor:
1. Categorizar e comparar as curvas de sobrevida.Exemplo: tratamento = 1 e idade > 55
tratamento = 1 e idade ≤ 55tratamento = 0 e idade > 55tratamento = 0 e idade ≤ 55
2. Categorizar e usar o teste log rank.3. Usar um modelo matemático (existem vários)
Mais de 1 confundidor:Modelagem matemática é a escolha mais razoável.
Regressão de Cox
Modela os dados usando o hazard ¨força de morbidade ou
mortalidade instantânea¨
Pressuposto:
•Para qualquer tempo t, o hazard entre aqueles expostos a certo
fator de risco [h1(t)] é múltiplo de algum hazard de referência
[h0(t)] (o hazard entre os não expostos)
h1(t) = h0(t) * B
h1(t) = h0(t) * e b ehh b
t
tHR ==
)(
)(
0
1 Log(HR) = b�
Modelo e Pressupostos
�
Modelo de Hazard Proporcional de Cox
Seja o conjunto de variáveis explanatórias: X = (X1, X2, ..., Xp)
h(t,X) = função de hazard para uma pessoa com um conjunto de X's
h0(t) = função de hazard base ou basal
h0(t) = não é conhecida no modelo de Cox
Observação:log odds basal não é conhecido na regressão logística para estudos caso controle).
∑= ii XethXth β)(),( 0
Informação geral:
� Modelo de Cox ou de Hazard proporcional é chamado de modelo não paramétrico (ou semi-paramétrico) porque as distribuições subjacentes não são conhecidas
� Alternativa de modelo paramétrico é correta, quando h0(t) é conhecida.
Ex: exponencial, Weibull, Gompertz, etc.
� Modelo paramétrico é preferível se o modelo correto a ser usado é conhecido
� Modelo de Cox dá aproximadamente a mesma resposta do modelo paramétrico (robusto).
� Modelo de Cox é o mais comumente utilizado
Variáveis no modelo de Cox:
� Variável dependente � tempo (até ocorrência do evento ou censura)� Variável evento � 1 = evento
0 = censura� X1, X2, ..., Xp
E's � exposição (ões)V's � confundidores potenciaisW's � modificadores de efeito potenciais
Exemplo:
Obs: Não há intercepto
)] x () x ()()(log)([
02121)(),( idadetrtwbctrtidadewbcctrtmentethXth δδγγβ ++++=
Vantagens do modelo de Cox:
� Útil para avaliar o efeito das variáveis explanatórias
� Variáveis explanatórias podem ser contínuas ou categóricas
� Pode incluir dados censurados
� Não é necessário conhecimento da distribuição da função de hazard subjacente (basal)
� sempre ≥ 0 (apropriado para uma taxa)
� Fornece mais informação do que o modelo logístico, particularmente para eventos não raros e/ou longos tempos de seguimento.
∑ ii Xe β
Razão de Hazard
Caso simples: 1 fator de risco
trtment: 1 = tratamento experimental0 = tratamento padrão
h(t,X) = h0(t)eβ(trtment)
trtment = 1: h(t,trtment) = h0(t)eβ(1)
trtment = 0: h(t,trtment) = h0(t)eβ(0)
βββ
β
eeeth
eth
th
thHRHazarddeRazão ==== − )01(
)0(
0
)1(
0
)()(
)0,()1,(
)(
Razão de Hazard
Caso simples: 1 covariável
age: X1 = 50X2 = 50
h(t,X) = h0(t)eβ(age)
age = 50: h(t,age) = h0(t)eβ(50)
age = 60: h(t,age) = h0(t)eβ(60)
10*)5060()50(
0
)60(0
)(
)(
)0,(
)1,()( ββ
β
βee
eth
eth
th
thHRHazarddeRazão ==== −
Caso multivariado: (Varias variáveis independentes)
X* = conjunto de X's para uma pessoaX = conjunto de X's para outra pessoa
Observação:análoga à regressão logística, mas possui uma razão de densidade incidência instantânea em vez de log odds
∑ −== )(
0
0*
),(*),(
iii XXeXth
XthHR β
)](...)()([ *2
*221
*11 kkk XXXXXXeHR −++−+−= βββ
Variável Coeficiente b1 Hazard Ratio Sexo (masc=1, fem=0) 1.2669 3.55 Fumo (sim=1, não=0) 0.6803 1.97 Idade55 (idade≥55=1, Idade<55=0)
0.1391 1.15
Hipertensão (sim=1, não=0) 0.5030 1.65 Hipercolesterolemia (sim=1, não=0)
0.4552 1.58
Obesidade (sim=1, não=0) 0.1876 1.21
Resultado da Regressão de coxdos preditores da incidência de doença coronariana, 3597 indivíduos entre 45 e 65 anos, 1987 a 1994. Washington1
Semelhanças:� CHD é uma doença relativamente rara OR ≈ HR� As perdas de follow-up e a distribuição dos tempos até a
ocorrência do evento são provavelmente não diferenciais entre os grupos (os vieses tendem a cancelar)