Как интерпретировать вывод предиката .coxph?

После подбора кокс-модели можно делать прогнозы и получать относительный риск новых данных. Что я не понимаю, так это то, как относительный риск рассчитывается для человека и к чему он относится (то есть для среднего населения)? Любые рекомендации по ресурсам, которые помогут понять (я не очень продвинут в анализе выживания, поэтому чем проще, тем лучше)?

predictive-models relative-risk cox-model

— user4673
источник

predict.coxph()вычисляет соотношение риска относительно среднего образца для всех $p$ предикторов. Факторы обычно преобразуются в фиктивные предикторы, среднее значение которых можно рассчитать. Напомним, что модель Кокса РН является линейной моделью для логарифмической опасности $\ln h(t)$ :

\ln h (t) = \ln h_{0} (t) + β_{1} X_{1} + \dots + β_{p} X_{p} = \ln h_{0} (t) + X β

$\ln h(t) = \ln h_{0}(t) + \beta_{1} X_{1} + \dots + \beta_{p} X_{p} = \ln h_{0}(t) + \bf{X} \bf{\beta}$

Где - неопределенная базовая опасность. Эквивалентно, опасность моделируется как . Соотношение рисков между двумя людьми и с предикторами $h_{0}(t)$ $h(t)$ $h(t) = h_{0}(t) \cdot e^{\beta_{1} X_{1} + \dots + \beta_{p} X_{p}} = h_{0}(t) \cdot e^{\bf{X} \bf{\beta}}$ $i$ $i'$ и $\bf{X}_{i}$ Таким образом, не зависят от базовой опасности и не зависят от времени: $\bf{X}_{i'}$ $t$

\frac{h_{i} (t)}{h_{i^{'}} (t)} = \frac{h_{0} (t) \cdot e^{X_{i} β}}{h_{0} (t) \cdot e^{X_{i^{'}} β}} = \frac{e^{X_{i} β}}{e^{X_{i^{'}} β}}

$\frac{h_{i}(t)}{h_{i'}(t)} = \frac{h_{0}(t) \cdot e^{\bf{X}_{i} \bf{\beta}}}{h_{0}(t) \cdot e^{\bf{X}_{i'} \bf{\beta}}} = \frac{e^{\bf{X}_{i} \bf{\beta}}}{e^{\bf{X}_{i'} \bf{\beta}}}$

Для оценки соотношения рисков между людьми и мы просто включаем оценки коэффициентов для , давая и . $i$ $i'$ $b_{1}, \ldots, b_{p}$ $\beta_{1}, \ldots, \beta_{p}$ $e^{\bf{X}_{i} \bf{b}}$ $e^{\bf{X}_{i'} \bf{b}}$

В качестве примера на R я использую данные из приложения Джона Фокса по модели Кокса-PH, которые дают очень хороший вводный текст. Сначала мы извлекаем данные и строим простую модель Кокса-PH для времени ареста освобожденных заключенных ( fin: фактор - полученная финансовая помощь с фиктивным кодированием "no"-> 0, "yes"-> 1 age,: возраст на момент освобождения, prio: количество предыдущих приговоров):

> URL   <- "http://socserv.mcmaster.ca/jfox/Books/Companion/data/Rossi.txt"
> Rossi <- read.table(URL, header=TRUE)                  # our data
> Rossi[1:3, c("week", "arrest", "fin", "age", "prio")]  # looks like this
  week arrest fin age prio
1   20      1  no  27    3
2   17      1  no  18    8
3   25      1  no  19   13

> library(survival)                                      # for coxph()    
> fitCPH <- coxph(Surv(week, arrest) ~ fin + age + prio, data=Rossi)    # Cox-PH model
> (coefCPH <- coef(fitCPH))                              # estimated coefficients
     finyes         age        prio 
-0.34695446 -0.06710533  0.09689320

Теперь мы включаем выборочные средние значения для наших предикторов в формулу : $e^{\bf{X} \bf{b}}$

meanFin  <- mean(as.numeric(Rossi$fin) - 1)   # average of financial aid dummy
    meanAge  <- mean(Rossi$age)                   # average age
meanPrio <- mean(Rossi$prio)                  # average number of prior convictions
rMean <- exp(coefCPH["finyes"]*meanFin        # e^Xb
           + coefCPH["age"]   *meanAge
           + coefCPH["prio"]  *meanPrio)

Теперь мы включаем значения предикторов первых 4 человек в формулу . $e^{\bf{X} \bf{b}}$

r1234 <- exp(coefCPH["finyes"]*(as.numeric(Rossi[1:4, "fin"])-1)
           + coefCPH["age"]   *Rossi[1:4, "age"]
           + coefCPH["prio"]  *Rossi[1:4, "prio"])

Теперь вычислите относительный риск для первых 4 человек относительно среднего значения по выборке и сравните с выходом из predict.coxph().

> r1234 / rMean
[1] 1.0139038 3.0108488 4.5703176 0.7722002

> relRisk <- predict(fitCPH, Rossi, type="risk")   # relative risk
> relRisk[1:4]
        1         2         3         4 
1.0139038 3.0108488 4.5703176 0.7722002

Если у вас стратифицированная модель, сравнение по сравнению predict.coxph()со средними по стратам, это можно контролировать с помощью referenceопции, которая описана на странице справки.

— каракал
источник

+1, потому что не совсем понятно, что именно предсказывает .coxph со страницы справки!

— Октябрь

это было здорово! Очень просто понять!

— user4673

meanFin <- mean(as.numeric(Rossi$fin) - 1)не имеет большого смысла, так как finявляется категоричным. Вам не нужно modeFin <- get_Mode(Rossi$fin)в этом случае?

— Жубарб

@Zhubarb finявляется двоичным, поэтому числовое представление фактора имеет только значения 1 и 2. Вычитание 1 дает нам фиктивную переменную со значениями 0 и 1, которая также появляется в матрице проекта. Обратите внимание, что это не будет работать для факторов с более чем 2 уровнями. Это, конечно , спорно , делает ли усреднение фиктивного смысла, но это то, что predict.coxph()делает.

— Каракал

Словом, как бы вы интерпретировали отношение рисков 3,01 (например, relRisk [2])?

— RNB