Как мне интерпретировать кривую выживания модели риска Кокса?

9

Как вы интерпретируете кривую выживания из модели пропорционального риска Кокса?

В этом игрушечном примере предположим, что у нас есть модель пропорционального риска Кокса для ageпеременной в kidneyданных, и сгенерируем кривую выживания.

library(survival)
fit <- coxph(Surv(time, status)~age, data=kidney)
plot(conf.int="none", survfit(fit))
grid()

Например, в момент , какое утверждение верно? или оба не правы? $200$

Утверждение 1: у нас будет 20% оставленных предметов (например, если у нас человек, к дню у нас должно остаться приблизительно ), $1000$ $200$ $200$
Утверждение 2: Для одного данного человека он / она имеет шанс выжить в день . $20\%$ $200$

Моя попытка: я не думаю, что эти два утверждения совпадают (поправьте меня, если я ошибаюсь), поскольку у нас нет предположения iid (время выживания для всех людей НЕ зависит от одного распределения независимо). Это похоже на логистическую регрессию в моем вопросе здесь , уровень опасности каждого человека зависит от для этого человека. $\beta^Tx$

r survival cox-model likelihood machine-learning deep-learning generative-models machine-learning reinforcement-learning q-learning regression multicollinearity convergence beta-distribution bernoulli-distribution machine-learning self-study pattern-recognition neural-networks stochastic-processes linear

— Хайтау Ду
источник

Обратите внимание, что ваша модель предполагает независимость от времени события.

— ocram

анализ выживания может иметь предположения о независимости

— Аксакал

так что, похоже, вопрос действительно в R-кодировании, а не в чистой статистике. необходимо знать синтаксис и особенности конкретных функций, используемых в примере. если это так, разве это не в какой-то степени не так? в противном случае вам нужно объяснить, что происходит тем, кто не использует R

— Аксакал,

5

Поскольку опасность зависит от ковариат, также зависит и функция выживания. Модель предполагает, что функция опасности человека с ковариантным вектором равна Следовательно, кумулятивная опасность этого человека где мы можем определить как базовую совокупную опасность. Функция выживания для индивида с ковариатическим вектором , в свою очередь, где мы определяем в качестве базовой функции выживания. $x$

h (t; x) = h_{0} (t) e^{β^{'} x} .

$h(t;x) = h_0(t) e^{\beta'x}.$

H (t; x) = \int_{0}^{t} h (u; x) d u = \int_{0}^{t} h_{0} (u) e^{β^{'} x} d u = H_{0} (t) e^{β^{'} x},

$H(t;x) = \int_0^t h(u;x) du=\int_0^t h_0(u) e^{\beta'x} du = H_0(t)e^{\beta'x},$

H_{0} (t) = \int_{0}^{t} h_{0} (u) d u

$H_0(t)=\int_0^t h_0(u) du$

x

$x$

S (t; x) = e^{- H (t; x)} = e^{- H_{0} e^{β^{'} x}} = S_{0} (t)^{e^{β^{'} x}}

$S(t;x) = e^{-H(t;x)}=e^{-H_0 e^{\beta'x}}=S_0(t)^{e^{\beta'x}}$

S_{0} (t) = e^{- H_{0} (t)}

$S_0(t) = e^{-H_0(t)}$

Учитывая оценки и коэффициентов регрессии и базовой функции выживания, оценка функции выживания для индивидуума с ковариатным вектором дается как . $\hat\beta$ $\hat S_0(t)$ $x$ $\hat S(t;x)=\hat S_0(t)^{e^{\hat\beta'x}}$

Вычислив это в R вы указываете значение ваших ковариат в newdataаргументе. Например, если вы хотите, чтобы функция выживания для людей в возрасте = 70, в R, сделайте

plot(survfit(fit, newdata=data.frame(age=70)))

Если вы, как и вы, опускаете newdataаргумент, его значение по умолчанию равно средним значениям ковариат в образце (см. ?survfit.coxph). Итак, на вашем графике показана оценка . $S_0(t)^{e^{\beta'\bar x}}$

— Ярле Туфто
источник

Я с тобой согласен. Это хорошо написанный ответ. Я извиняюсь перед ОП за свою ошибку и ценю то, как ОП исправил ее.

— Майкл Р. Черник

@ hxd1101 После survfit.coxphболее внимательного прочтения страницы справки я исправил ошибку в своем ответе, см. обновление.

— Ярле Туфто

2

У нас останется 20% предметов (например, если у нас 1000 человек, к 200 дню у нас должно быть 200 человек)? или для данного человека он имеет 20% шансов выжить в день 200?

В своем наиболее чистом виде кривая Каплана-Мейера в вашем примере не дает ни одного из приведенных выше утверждений.

Первое утверждение делает прогнозная проекция будет . Базовая кривая выживания описывает только ваше прошлое. Да, 20% вашего образца выжили к 200 дню. 20% выживут в следующие 200 дней? Не обязательно.

Чтобы сделать это утверждение, вы должны добавить больше предположений, построить модель и т. Д. Модель даже не должна быть статистической в некотором смысле, как логистическая регрессия. Например, это может быть PDE в эпидемиологии и т. Д.

Ваше второе утверждение, вероятно, основано на некотором предположении об однородности: все люди одинаковы.

— Аксакал
источник

Я не думаю, что утверждение 2 является правильным, так как у каждого человека разные и вносит свой вклад в опасность. как мы можем предположить, что все люди одинаковы?

x

$x$

β^{T} x

$\beta^Tx$

— Haitao Du

@ hxd1011, это зависит от вашей модели. Если бы вы моделировали детали автомобилей, то вполне могли бы предположить, что они одинаковые. с другой стороны, их неудачи могут быть соотнесены с номером партии, тогда они не совпадают и т. д.

— Аксакал,

Я отредактировал свой вопрос, чтобы он был более конкретным по модели Кокса. Ваш ответ по кривой Kaplan_Meier все еще применим?

— Haitao Du

2

Спасибо за ответ Ярле Туфто. Я думаю, что я должен быть в состоянии ответить на него сам: оба утверждения являются ложными . Сгенерированная кривая но не . $S_0(t)$ $S(t)$

Функция выживания базовой линии будет равна только тогда, когда . Следовательно, кривая НЕ описывает все население или отдельного человека. $S_0(t)$ $S(t)$ $x=0$

— Хайтау Ду
источник

0

Ваш первый вариант правильный. В общем случае , указывает на то, что 20% первоначальных пациентов сохранились до дня , без учета цензурирования . По данным, подвергнутым цензуре, неверно утверждать, что 20% были еще живы в тот день , поскольку некоторые из них были потеряны для последующего наблюдения, а их статус неизвестен. Лучший способ выразить это - оценить, что доля пациентов, которые еще живы в тот день, составляет 20% . $S(t) = 0.2$ $t$

Второй вариант (шанс выжить еще один день при условии выживания до ) - , где обозначает функцию опасности. $t$ $1-h(t)$ $h(t)$

Что касается предположений: я думал, что обычные тесты коэффициентов в регрессии Кокса предполагают независимость, при условии, что наблюдаемые ковариаты? Кажется, что даже оценка Каплана-Мейера требует независимости между временем выживания и цензурой ( ссылка ). Но я могу ошибаться, поэтому исправления приветствуются.

— juod
источник