Какое значение «


18

Какое значение приведено в сводке модели Кокша в R? Например,R2

Rsquare= 0.186   (max possible= 0.991 )

Я по глупости включил его в рукопись в качестве значения и рецензент вскочил на него, сказав, что он не знал об аналоге статистики из классической линейной регрессии, разрабатываемой для модели Кокса, и, если она была, пожалуйста, предоставить ссылку. Любая помощь будет отличной!R2R2


1
В большинстве ситуаций, когда понятие выходит за рамки классической линейной регрессии, это квадратная корреляция между наблюдаемыми значениями и предсказанными в рамках модели. Может ли это быть применимо здесь? R2
Макро

2
Нет, это не связано с этим.
Фрэнк Харрелл

Ответы:


15

Используя getS3method("summary","coxph")вы можете посмотреть, как он рассчитывается.

Соответствующие строки кода следующие:

logtest <- -2 * (cox$loglik[1] - cox$loglik[2])
rval$rsq <- c(rsq = 1 - exp(-logtest/cox$n), maxrsq = 1 - 
        exp(2 * cox$loglik[1]/cox$n))

Здесь cox$loglikэто «вектор длины 2, содержащий логарифмическое правдоподобие с начальными значениями и с конечными значениями коэффициентов» (см. ?coxph.object) И cox$n«число наблюдений, использованных в подгонке».


5
Если я не ошибаюсь, это псевдо R-квадрат Кокса и Снелла. Для объяснения и сравнения различных псевдо-R-квадратов см. Ats.ucla.edu/stat/mult_pkg/faq/general/psuedo_rsquareds.htm .
остановка

4

Деление на числа наблюдений в резюме неправильно, это должно быть числом без цензуры событий; см. O'Quigley et al. (2005) Объясненная случайность в моделях пропорциональных опасностей Статистика в медицине с. 479-489.ncoxph


4
Неправильно, вы делите на количество наблюдений, как бы странно это ни звучало. На первоначальный вопрос странно, что рецензент не знал бы о чем-то, что существует уже 20 лет для модели Кокса.
Фрэнк Харрелл

Добавление к обмену между Ronghui Xu и @Frank Harrell не только «звучит странно», деленное на количество наблюдений, но и не работает. Чтобы увидеть это, рассмотрим бета-версию, фиксированную при некотором значении, так что, примерно, E (R2) = 0,5, и такое же ковариатное распределение, т. Е. Все то же самое, за исключением того факта, что в исследовании 1 уровень цензуры в два раза выше, чем в исследовании 2. Хотя мы должны оценивать одно и то же количество популяции, оценки R2 в исследовании 1 будут примерно вдвое меньше, чем в исследовании 2, независимо от размера выборки. Вместо 0,5 мы бы получили около 0,25.

R2

Отвечая на замечание Фрэнка, я бы согласился, что это не так просто, и что наблюдение Фрэнка относительно логарифмического правдоподобия является правильным. Я только когда-либо рассматривал эту величину как приближение к последовательной оценке четко определенного количества населения, основанного на получении информации. В статье, на которую ссылается Ronghui Xu, проводится симуляция. Они показывают, что влияние цензуры, хотя и не отсутствует, будет намного слабее, когда мы делим количество сбоев, а не общее количество наблюдений.

1
Джон, вы с Ronghui скажете нам, какую меру вы рекомендуете? Я ищу часть объясненной случайности, которая очень независима от распределения цензуры, является сильной аналогиейр2в линейных моделях, и это имеет готовый аналог для логистической регрессии. Я наконец прочитал вашу отличную статью 2005 года - отличная работа.
Фрэнк Харрелл
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.