Лекция 12. Анализ выживаемости
Грауэр Л.В., Архипова О.А.
CS Center
Санкт-Петербург, 2014
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 1 / 26
Cодержание
Содержание
1 Анализ выживаемости
2 Цензурирование
3 Функция выживаемости и функция риска
4 Оценка функции выживаемости и функции рискаПараметрические методыНепараметрические методы
5 Сравнение двух функций выживаемостиЛогранговый критерийКритерий Гехана
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 2 / 26
Анализ выживаемости
Анализ выживаемости
Пусть T — неотрицательная случайная величина, представляющаясобой время ожидания до наступления некоторого события.Назовем исследуемое событие смертью,время ожидания — "временем выживания".
Продолжительность жизни после операции, начала леченияВозраст при вступлении в брак и продолжительность бракаВремя пребывания в городеВремя пребывания на определенном месте работы
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 3 / 26
Анализ выживаемости
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 4 / 26
Цензурирование
Цензурирование
Говорят, что имеет место цензурирование, если событие ("смерть") ненаступило до конца исследования.
Пациент все еще живПациент переехал (пропала связь с пациентом)Пациент умер от другой причины (автокатастрофа)
Пусть i — номер наблюдаемого объекта, Ti — время жизни объекта i(непрерывная или дискретная случачная величина), Ui — переменнаяцензурирования.
Xi = min(Ti ,Ui )
— цензурированное время жизни объекта i .
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 5 / 26
Цензурирование
Механизмы цензурирования
Фиксированное цензурированиеВыборка из n объектов наблюдается в течение фиксированноговремени τ . Число смертей случайно, но общая продолжительностьисследования фиксирована. Каждый объект имеет максимальновозможный период наблюдения τi , i = 1, . . . , n. Вероятность того,что объект будет жив в конце исследования, равна S(τi ).Случайное цензурированиеВыборка из n объектов наблюдается столько, сколько необходимо,чтобы событие ("смерть") испытали d объектов. Число dфиксировано заранее и его можно использовать в качествепараметра. Однако время исследвания не может быть точноизвестно заранее
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 6 / 26
Цензурирование
Направления цензурирования
Правосторонее цензурированиеОбусловлено выбыванием объектов из исследования илиокончанием самого исследованияНаблюдаются Xi = min(Ti ,Ui ) для каждого i и индикатор смертиδi (δi = 1, если Ti ≤ Ui , и δi = 0, если Ti > Ui )Левосторонее цензурированиеОбъект выбыл до начала исследованияНаблюдаются Yi = max(Ti ,Ui ) для каждого i и индикатор смертиδi (δi = 1, если Ti ≤ Ui , и δi = 0, если Ti > Ui
Интервальное цензурированиеНаблюдаются (Li ,Ri ) такие, что Ti ∈ (Li ,Ri )
Далее будем рассматривать только правостороннее цензурирование.
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 7 / 26
Цензурирование
Независимое (неинформативное) цензурированиеUi не зависит от Ti
Конец исследования запланирован заранее (оговорены точныесроки, например, 2 года), случайное выбывание объекта (авария)Информативное цензурированиеРаспределение Ui зависит от каких-либо параметров,определяющих распределение Ti
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 8 / 26
Функция выживаемости и функция риска
Функция выживаемости и функция риска
Пусть T — непрерывная случайная величина с плотностьюраспределения f (t) и функцией распределения F (t) = P{T ≤ t}.Рассмотрим функцию выживаемости
S(t) = P{T > t} = 1− F (t) =
∫ ∞t
f (x)dx (1)
— вероятность того, что исследуемое событие не наступило к моментувремени t.Так как событие ("смерть") не может произойти к моменту 0,S(0) = 1.
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 9 / 26
Функция выживаемости и функция риска
Рассмотрим функцию риска — мгновенную интенсивностьосуществления события, —
λ(t) = limdt→0
P{t < T ≤ t + dt|T > t}dt
=f (t)dt
S(t)dt=
f (t)
S(t)
Заметим, что −f (t) = S ′(t), тогда
λ(t) = − d
dtlog S(t),
S(t) = exp
{−∫ t
0λ(x)dx
}.
Кумулятивный риск
Λ(t) =
∫ t
0λ(x)dx = − lnS(t)
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 10 / 26
Функция выживаемости и функция риска
Функция рискаПостоянная: λ(t) ≡ C , когда Λ(t) = Ct и S(t) = e−Ct :продолжительность жизни при наличии хронического заболеванияВозрастающая: старение после 65Убывающая: продолжительнсоть жизни после операцииВаннообразная: летальность, зависящая от возраста
Функция выживаемости Функция риска
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 11 / 26
Функция выживаемости и функция риска
Характеристики положения продолжительности жизни
Ожидаемая продолжительность жизни
µ =
∫ ∞0
tf (t)dt.
Медиана продолжительности жизни— τ такое, что S(τ) = 0.5На практике медиана не всегда достигается. В этом случае выюбираютнаименьшее τ , для которого S(τ) ≤ 0.5
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 12 / 26
Оценка функции выживаемости и функции риска
Оценить функцию выживаемости/риска можно одним из двухспособов
установив параметрическую модель λ(t), основываясь наконкретной плотности распределения f (t)
воспользовавшись эмпирическими оценками функции выживания(непараметрические методы)
Если цензурирование отсутствует, в качестве оценки функциивыживания S(t) можно взять долю объектов со временем жизни,большим t.Если цензурирование есть, оценка S(t) является плохой оценкойистинной функции выживания S(t).
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 13 / 26
Оценка функции выживаемости и функции риска Параметрические методы
Некоторые параметрические законы выживнаия
Экспоненциальное распределение
f (t) = ae−at , t ≥ 0,
S(t) = e−at , λ(t) = a, Λ(t) = at
Распределение Вейбулла
f (t) = katk−1e−atk, t ≥ 0,
S(t) = e−atk, λ(t) = katk−1, Λ(t) = atk
Распределение Рэлея
λ(t) = a0 + a1(t)
Лог-нормальноеlogT ∼ нормально распределение
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 14 / 26
Оценка функции выживаемости и функции риска Непараметрические методы
Непараметрические методы
Рассмотрим следующие непараметрические методы оценки функциивыживанаия S(t)
Оценка Каплана-МейераТаблицы жизниОценка кумулятивной функции риска
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 15 / 26
Оценка функции выживаемости и функции риска Непараметрические методы
Оценка Каплана-Мейера
Разобьем временной промежуток исследования на интервалы так,чтобы время каждого события смерти или цензурирования попадалипо возможности в разные интервалы
S(t) = Πj :τj<trj − dj
rj= Πj :τj<t
(1−
djrj
), (2)
гдеτ1, . . . , τk — моменты времени смертей, наблюдаемые в выборкеdj — число смертей в момент τjrj — число объектов, умерших или цензурированных в момент τj илипозже. Справедливы следующие соотношения
rj = rj−1 − dj−1 − cj−1, rj =∑l≥j
(cl + dl),
где cj — число цензурированных объектов в промежутке между jтым и(j + 1)м интервалами. Объекты, цензурированные в момент τjвключаются в cj
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 16 / 26
Оценка функции выживаемости и функции риска Непараметрические методы
Свойства оценки Каплана-Мейера
В случае отсутствия цензурирования S(t) = S(t)S(t) имеет асимптотическое нормальное распределение.S(t) является асимптотически несмещенной оценкой S(t)Дисперсия S(t) согласно формуле Гринвуда
var(S(t)
)=[S(t)
]2 ∑j :τj<t
dj(rj − dj)rj
Доверительный интервал для S(t)(S(t)− z1−α/2se[S(t)], S(t) + z1−α/2se[S(t)]
)Однако данный подход может приводить к значениям >1 или <0.
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 17 / 26
Оценка функции выживаемости и функции риска Непараметрические методы
Предпочтительней подход с переходом к функцииL(t) = log(− log(S(t))) и построением доверительного интрвала дляL(t).Пусть L(t) = log(− log(S(t)))
var(L(t)
)=
1[S(t)
]2 ∑j :τj<t
dj(rj − dj)rj
,
тогда доверительный интервал для L(t)(L(t)− z1−α/2se[L(t)], L(t) + z1−α/2se[L(t)]
)и доверительный интервал для S(t)(
S(t)ez1−alpha/2se(L(t))
, S(t)−ez1−alpha/2se(L(t))
)
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 18 / 26
Оценка функции выживаемости и функции риска Непараметрические методы
Таблицы жизни
Используются для группированных данных и представляют собойтабличное представление информации о функции выжимаемостиобъекта
Разобьем временной промежуток исследования на интервалы[tj−1, tj) — jй интервал, начинаются с t0cj — число цензурированных объектов в интревале jdj — число "смертей"в интревале jrj — число объектов, пришедших в интревале j
Так как данные сгруппированы, для вычисления оценок необходимоправильно учесть цензурирование:
в начале каждого интревала r ′j = rj − cj
в конце каждого интервала r ′j = rj
в середине интервала r ′j = rj − cj/2
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 19 / 26
Оценка функции выживаемости и функции риска Непараметрические методы
Оценка функции выживаемости в момент tj
S(tj) = Πl≤j
(1− dl
r ′l
)Оценка функции риска для jго интервала
λ(tmj) =dj
(tj − tj−1)(r ′j − dj/2),
tmj - центр jго интервала.
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 20 / 26
Оценка функции выживаемости и функции риска Непараметрические методы
Оценка кумулятивной функции риска
Для построения оценки кумулятивной функции риска Λ(t) разобьемвременной промежуток исследования на интервалы так, чтобы времякаждого события смерти или цензурирования попадали повозможности в разные интервалы и вычислимdj — число смертей в момент τjrj — число объектов, умерших или цензурированных в момент τj илипозжеОценка Нельсона-Аалена
ΛNA(t) =∑j :τj<t
djrj.
Оценка на основе оценки Каплана-Мейера
ΛKM = − log SKM(t)
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 21 / 26
Сравнение двух функций выживаемости
Сравнение двух функций выживаемости
Предположим, что мы наблюдаем две группыГруппа 1: (X11, δ11), . . . , (X1n1 , δ1n1)Группа 0: (X01, δ01), . . . , (X0n0 , δ0n0)где Xij — цензурированное время жизни объекта j из группы i ,δij — индикатор смерти объекта j группы i .
Проверяется гипотеза о равенстве функций выживания двух группH0 : S1(t) = S0(t)
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 22 / 26
Сравнение двух функций выживаемости Логранговый критерий
Логранговый критерий
Логранговый критерий основан на построении таблиц сопряженности2х2 в каждый момент "смерти"и сравнении долей смертей обеих группс учетом числа наблюдаемых объектов в соответствующий момент"смерти".
Пусть t1, . . . , tK — K упорядоченных по возрастанию моментовсмерти. В момент tj имеем следующую таблицу 2х2:
Group Die Not Total0 d0j r0j − d0j r0j1 d1j r1j − d1j r1j
Total dj rj − dj rj
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 23 / 26
Сравнение двух функций выживаемости Логранговый критерий
Статистика критерия
χ2logrank =
[∑Kj=1(d0j − r0jdj/rj)
]2∑K
j=1r1j r0jdj (rj−dj )
r2j (rj−1)
(3)
В предположении о независимости всех таблиц, статистика (3) имеетасимптотическое распределение χ2 с 1 степенью свободы.Нулевая гипотеза отклоняется на уровне значимости α, есливыборочное значение статистики χ2
logrank > χ21−α(1)
Логранговый критерий применим, если- выборки независимы и случайны- функции выживаемости связаны соотношением S1(t) = [S0(t)]ψ илихотя бы они не пересекаются.
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 24 / 26
Сравнение двух функций выживаемости Критерий Гехана
Критерий Гехана
Критерий Гехана представляет собой обобщение критерия Вилкоксонана случай цензурированных данных.Каждый объект Z0i группы 0 сравнивают с каждым объектом Y1j
группы 1 по времени жизни и вычисляют статистику
Uij = U{Z0i ,Y1j} =
1, если T0i > T1j или X0i ≥ T1j ;0, если T0i = T1j или объект
с наименьшим временем был цензурирован−1, если T0i < T1j или T0i ≤ X1j ;
Статистика критерия
W =
n0∑i=1
n1∑j=1
Uij (4)
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 25 / 26
Сравнение двух функций выживаемости Критерий Гехана
При выполнении нулевой гипотезы статистика W имеет среднее,равное 0, и дисперсию равной
var(W ) =n0n1
(n0 + n1)(n0 + n1 − 1)
n0+n1∑i=1
n0+n1∑j=1
Uij
2
При выполнении нулевой гипотезы статистика W√var(W )
имеетасимптотическое стандартное нормальное распределение.
Грауэр Л.В., Архипова О.А. (CSC) Анализ выживаемости Санкт-Петербург, 2014 26 / 26
Top Related