Post on 30-Dec-2015
description
主编 周仁郁
9.1 生存时间 9.1.1 生存函数
生存分析,是把事件的结果和出现这一结果所经历的时间,结合起来分析的一种统计方法.
例 1 6 名肝癌病人在 1~12 月进入观察,其中 A ,D , E 在研究结束前死亡, C 由于某种原因失访,B 、 F 到研究结束仍未获得确切的生存时间
病人 开始月 终止月 生存天数 结局A 1 5 150 死亡B 2 12 330 生存C 3 7 120 失访D 4 8 120 死亡E 5 9 120 死亡F 7 12 180 生存
可以看出, A 、 D 、 E 在研究结束前死亡, C 由于某种原因失访, B 、 F 到研究结束仍未获得确切的生存时间
A
B
C
D
E
F
0 1272
3 541 8 9 10 116
生存时间是指从某事件开始发生到出现某种反应所经历的时间,可分为完全数据与截尾数据两种类型完全数据是指从起点到死亡所经历的时间,截尾数据,是指由于病人发生迁移或死于其他疾病造成失访、或者改变方案、结束时间尚未发生等截尾情况
生存时间有其特定的分布,描述生存时间的分布规律,可以使用死亡密度函数、生存函数、危险函数等 3 种方法
死亡密度函数 f(t) 表示患者在时间 t 的瞬间死亡概率
)()(
lim)(0
tFt
ttTtPtf
t
其中, F(t) 称为死亡分布函数。以 t 为横轴、 f(t)为纵轴绘制的曲线,称为死亡密度曲线
)(tf
)(tS)(tF
tO
)(tS
t
)(th
O
生存函数 S(t) ,表示患者生存时间大于 t 的累积概率 S(t) = P(T > t) = 1 - F(
t) S(t) 为 t 右边死亡密度曲线下面积,也称为生存率。以 t 为横轴、 S(t) 为纵轴绘制的曲线,称为生存率曲线或 Kaplan - Meier 曲线
危险函数 h(t) 又称风险函数,表示 t 的瞬间死亡概率
)(
)(
)(1
)()(
tS
tf
tF
tfth
以 t 为横轴、 h(t) 为纵轴绘制的曲线称危险函数曲线 9.1.2 生存率计算
生存率的计算,有非参数方法与参数方法。参数方法虽然效率较高,但对生存时间的分布要求符合某种类型,而且计算复杂。非参数方法,主要有寿命表与概率乘积两种方法,计算比较容易,应用广泛
概率乘积法也称为乘积极限法,对不分组资料用概率乘法估计生存率, 1958 年由 Kaplan - Meier 提出
把生存时间 t 从小到大排序,重复数据只列一次。分别计算各时段的初始例数 n 及该时段的死亡例数d ,得到死亡概率 q 及生存概率 p
q = d/n , p = 1 -q
生存率 S(tk) 的估计式
S(tk) = P(T≥t) = p1p2…p
k 生存率 S(tk) 的标准误为
k
i ii
ik np
qtSS
1
)(
例 2 中药组与对照组两种疗法治疗白血病,估计两组的生存率
中药组 5 17 22 31 37 37 3928
+36
+40
+40
+
对照组 2 4 9 9 10 16 24 27 27 4 + 40+对照组按生存时间 t 排序,并分段进行计算
在第 1 时段, t1 = 2 ,存活时间大于等于 2 例数为11 ,死亡时间为 2 的例数为 1 ,得初始例数 n1 = 11 ,死亡例数 d1 = 1 ,死亡概率 q1 = 1/11 ,生存概率 p1 = 10/11 生存率 S(t1) = p1 = 10/11
在第 2 时段,死亡概率 q2=1/10 ,生存概率 p2=9/10
序号 生存月 初始数 死亡数 截尾数 死亡概率 生存概率 生存率 标准误1 2 11 1 1/11 10/11 0.9091 0.0867
2 4 10 1 1 1/10 9/10 0.8182 0.1163
3 9 8 2 2/8 6/8 0.6136 0.1557
4 10 6 1 1/6 5/6 0.5114 0.1599
5 16 5 1 1/5 4/5 0.4091 0.1572
6 24 4 1 1/4 3/4 0.3068 0.1475
7 27 3 2 2/3 1/3 0.1023 0.0969
8 40 1 1
类似计算中药组的生存率
tO
)(tS
4010 20 30
9.1.3 时序检验 时序检验也称对数秩检验 (Log-Rank Test), 可用
于两个或多个样本生存时间的比较,条件是生存率曲线不能交叉。有交叉时采用分层处理或多因素分析
若 k (≥ 2 )组的生存时间相同,则在 ti 点有相同的死亡率 di/ni ,由此算出第 j 组在 ti 时点理论死亡例数 Eji Eji = njidi/ni
第 j 组理论数 Ej 与实际数 Oj 构成卡方统计量
)1(~)( 2
1
22
k
E
EOk
j j
jj
理论数有小于 5 者取修正值
)1(~)5.0|(| 2
1
22
k
E
EOk
j j
jj
在假设检验有统计学意义时,可以从生存率曲线目测判断、或半数生存期比较、或相对危险度比较几方面来考察效果的好坏。第 i 组与第 j 组相对危险度
jj
iiij EO
EOh
/
/
例 3 对例 2 数据用时序检验比较两组的生存时间 H0:两组的生存时间相等, H1:两组生存时间不等 两组数据混合排序, k = 2 ,分别计算两组及合计组的 n 、 d ,并分段进行计算
在第一时段, n1 = 22 、 d1 = 1 ,中药组 n11 = 11、 E11 = 11×1/22 = 0.5 ,对照组 E21 = 0.5
序号 生存月数 t
中药组 对照组 合计 理论死亡例数
n1i d1i w1i n2i d2i w2i ni di E1i E2i
1 2 11 11 1 22 1 0.5000 0.5000
2 4 11 10 1 1 21 1 0.5238 0.4762
3 5 11 1 8 19 1 0.5789 0.4211
4 9 10 8 2 18 2 1.1111 0.8889
5 10 10 6 1 16 1 0.6250 0.3750
6 16 10 5 1 15 1 0.6667 0.3333
7 17 10 1 4 14 1 0.7143 0.2857
8 22 9 1 4 13 1 0.6923 0.3077
9 24 8 4 1 12 1 0.6667 0.3333
10 27 8 3 2 11 2 1.4545 0.5455
11 28 8 1 1 9 0
12 31 7 1 1 8 1 0.8750 0.1250
13 36 6 1 1 7 0
14 37 5 2 1 6 2 1.6667 0.3333
15 39 3 1 1 4 1 0.7500 0.2500
16 40 2 2 1 1 3 0
合计 7 9 10.825 5.175
死亡例数各列分别竖加得
O1 = 7 , O2 = 9 , E1 = 10.825 , E2 =5.175χ2=(7-10.825)2/10.825+(9-5.175)2/5.175=4.1787
df=2-1=1 ,单侧概率 0.025<P<0.05 ,以水准 0.05拒绝 H0 ,两组的生存时间不等,可以认为中药加化疗方法治疗白血病的效果优于单纯化疗方法 9.1.4 Gehan 比分检验 各组生存分布之间呈比例风险关系, h1(t)/h2(t)保持
相对稳定水平,时序检验效率较高。若 h1(t)/h2(t) 没有保持相对稳定水平,则应使用 Gehan 比分检验
各组数据按生存时间由小到大统一排序,在时间 ti
,各组死亡数与截尾数之和记为 mji ,合计数记为 m
i 。从上到下统计各生存时间小于 ti 的例数,记为 R1i
,从下到上统计各生存时间大于 ti 的例数,记为 R2i
以 Vji=mji(R1i-R2i) 为各组的比分, Vi2=mi(R1i-R2i) 为
合计数的比分,构成标准正态变量进行检验
221
1
)1( i
i
VNN
NN
Vu
其中, Nj =∑ mji , N =∑ mi ,且∑ V1i =-∑ V2i
例 4 对例 2 数据,用 Gehan 比分检验比较两组的生存时间是否相同
H0:两组的生存时间相等, H1:两组生存时间不等 两组数据混合排序, R1i 从上到下统计, t1 = 2 时无生存时间小于 2 的, R11 = 0; t4 = 5 时不能肯定 4 + 比它小, R14 = 2 。 R2i 从下到上统计, t17 = 40+ 时,截尾数据无法判断确切的生存时间, R2,17 = 0; t16 = 39 时生存时间大于 39 的有 3 例, R2,16 = 3。其余类似计算 N1 = 11 , N2 = 11 , N = 22 ,∑ V1i = 66 ,∑ V2
i =- 66 ,∑ Vi2 = 3034
月数 t m1 m2 m R1 R2 R1 - R2 V1 V2 V2
2 1 1 0 21 - 21 0 - 21 441
4 1 1 1 20 - 19 0 - 19 361
4+ (1) 1 2 0 2 0 2 4
5 1 1 2 18 - 16 - 16 0 256
9 2 2 3 16 - 13 0 - 26 338
10 1 1 5 15 - 10 0 - 10 100
16 1 1 6 14 - 8 0 - 8 64
17 1 1 7 13 - 6 - 6 0 36
22 1 1 8 12 - 4 - 4 0 16
24 1 1 9 11 - 2 0 - 2 4
27 2 2 10 9 1 0 2 2
28+ (1) 1 12 0 12 12 0 144
31 1 1 12 7 5 5 0 25
36+ (1) 1 13 0 13 13 0 169
37 2 2 13 4 0 18 0 162
39 1 1 15 3 12 12 0 144
40+ (2) (1) 3 16 0 16 32 16 768
合计 11 11 66 - 66 3034
双侧概率 P< 0.05 ,以 = 0.01水准拒绝 H0 ,两组的生存时间不等,可以认为中药加化疗方法治疗白血病的效果优于单纯化疗方法