Как оценить качество пригодности для жизненных функций


9

Я новичок в анализе выживания, хотя у меня есть некоторые знания в области классификации и регрессии.

Для регрессии мы имеем статистику MSE и R square. Но как мы можем сказать, что модель выживания A превосходит модель выживания B помимо каких-то графических графиков (кривая КМ)?

Если возможно, объясните разницу с примером (например, rpart package в R). Как вы можете показать, что одно дерево выживания CART лучше, чем другое дерево выживания CART? Какие метрики можно использовать?


3
Существует множество видов анализа выживания. Некоторые из них действительно основаны на регрессии. Некоторые из них, такие как КМ, можно было бы легче рассматривать как оценочные показатели для статистики выживания.
Алексис

Спасибо за ваши постоянные усилия по улучшению вашего вопроса. Я подозреваю, что это ответственно / подходит для CV сейчас. Я назначил это для открытия. Посмотрим, согласны ли другие. Может помочь, если вы опубликуете две модели выживания типа CART, чтобы люди могли объяснить эти проблемы.
gung - Восстановить Монику

1
Бен, То есть, по сути, вы говорите, что в регрессии пропорционального риска Кокса (до сих пор) нет хорошего способа оценить качество соответствия? R-квадрат не приводит к хорошим результатам, потому что он не может правильно обрабатывать цензурированные наблюдения и наблюдения без цензуры? Вы говорите о Harrells c, правильно ли я вас понял, что этот метод не применим к регрессии Кокса-PH?
Коста С.

Ответы:


9

р2(описано в другом ответе), что это очень зависит от цензурного распространения ваших данных. Другие естественные вещи, которые вы можете посмотреть, такие как отношение правдоподобия к нулевой модели, также имеют эту проблему. (Это в основном потому, что вклад цензурированной точки данных в вероятность очень отличается от вклада точки данных, где наблюдается событие, потому что один из них взят из PDF, а один из CDF.) Различные исследователи Предлагаемые способы обойти это, но те, которые я видел, обычно требуют от вас модели цензурного распределения или чего-то столь же непрактичного. Я не изучал, насколько плоха эта зависимость на практике, поэтому, если ваша цензура довольно мягкая, вы все равно можете посмотреть статистику на основе отношения правдоподобия. Для моделей выживания CART,

τтакже менее чувствительна, чем приведенная выше статистика, поэтому вы можете не выбирать между моделями на ее основе, если разница между ними невелика; он более полезен в качестве интерпретируемого показателя общей производительности, чем способ сравнения различных моделей.

(Наконец, конечно, если у вас есть конкретная цель для моделей - то есть, если вы знаете, какова ваша функция прогнозирования потерь - вы всегда можете оценить их в соответствии с функцией потерь! Но я угадываю вас » не так повезло ...)

Для более глубокого обсуждения статистики отношения правдоподобия и Harrell c , вы должны взглянуть на превосходный учебник Harrell по стратегиям регрессионного моделирования . Раздел по оценке моделей выживания - § 19.10, с. 492-493. Извините, я не могу дать вам однозначного ответа, но я не думаю, что это решенная проблема!


5

Регрессии пропорциональных рисков Кокса для данных о выживании можно рассматривать как соответствующие стандартным регрессиям во многих отношениях. Например, регрессии Кокса также предоставляют остаточные стандартные ошибки и статистику R-квадрата. Смотрите coxphфункцию в survivalпакете R. (Вы можете думать о кривых КМ как о непараметрических анализах в стандартной статистике. Как бы вы включили непараметрический тест в CART?) На практике с клиническими данными остаточные стандартные ошибки имеют тенденцию быть высокими, а значения R-квадрата - низкими. в регрессии Кокса.

Таким образом, стандартные регрессии и регрессии Кокса имеют схожие требования и ограничения. Необходимо убедиться, что данные соответствуют базовым допущениям, которые в анализе Кокса дополнительно включают предположение о том, что сравниваемые опасности пропорциональны во времени. Вам все равно придется избегать чрезмерной подгонки, и вам придется проверять свою модель. И, как я понимаю, CART, хотя я и не использую его сам, вы все равно столкнетесь с трудностями, связанными со сравнением не вложенных моделей.


Спасибо за ваш ответ о разнице и отношениях между регрессией Кокса и регрессией. Но я хочу знать, как сравнить две модели выживаемости дерева решений rpart (CART).
затопление

Документ с открытым доступом, ссылка на который находится по адресу projecteuclid.org/euclid.ssu/1315833185, представляет собой сравнительно недавний обзор и сравнение методов построения и выбора деревьев выживания на основе rpartи других пакетов и кода R.
EdM

Спасибо, что выложили статью. Я прочитаю газету прямо сейчас.
наводнение
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.