В анализе выживаемости, почему мы используем полупараметрические модели (пропорциональные риски Кокса) вместо полностью параметрических моделей?

24

Я изучал модель пропорциональных рисков Кокса, и этот вопрос скрыт в большинстве текстов.

Кокс предложил подгонку коэффициентов функции Хазарда с использованием метода частичного правдоподобия, но почему бы просто не подогнать коэффициенты параметрической функции выживания с использованием метода максимального правдоподобия и линейной модели?

В любых случаях, когда вы подвергали цензуре данные, вы можете просто найти область под кривой. Например, если ваша оценка составляет 380 со стандартным отклонением 80, а выборка подвергается цензуре> 300, то для этой выборки существует вероятность 84% в расчете вероятности, предполагающем нормальную ошибку.

survival cox-model

— user1956609
источник

Как бы мне ни хотелось задавать вопросы актуарной науки здесь, я должен сказать, что этот вопрос, вероятно, получит лучший ответ на сайте статистики, Cross Validated. Вы можете попросить модератора перенести его.

— График

Хорошо, не понял, что существовало. Не уверен, как запросить миграцию. Пожалуйста, мигрируйте?

@ Граф, я также не осознавал, что был один ... Я не нашел его в списке "всех сайтов", не могли бы вы дать ссылку здесь? Спасибо

27

Если вы знаете параметрическое распределение, которому следуют ваши данные, используйте подход максимального правдоподобия, и распределение имеет смысл. Реальное преимущество регрессии Пропорциональных рисков Кокса состоит в том, что вы все еще можете соответствовать моделям выживания, не зная (или не предполагая) распределение. Вы привели пример с использованием нормального распределения, но большинство времен выживания (и других типов данных, для которых используется регрессия Кокса PH) не приближаются к нормальному распределению. Некоторые могут следовать логарифмически нормальному, или вейбулловскому, или другому параметрическому распределению, и если вы готовы сделать такое предположение, тогда параметрический подход с максимальной вероятностью велик. Но во многих случаях реального мира мы не знаем, каково соответствующее распределение (или даже достаточно близкое приближение). С цензурой и ковариатами мы не можем сделать простую гистограмму и сказать «это похоже на… распределение для меня». Поэтому очень полезно иметь технику, которая работает хорошо, без необходимости конкретного распределения.

Зачем использовать опасность вместо функции распределения? Рассмотрим следующее утверждение: «Люди в группе A в два раза чаще умирают в возрасте 80 лет, чем люди в группе B». Теперь это может быть правдой, потому что люди в группе B, как правило, живут дольше, чем люди в группе A, или это может быть потому, что люди в группе B, как правило, живут более короткой жизнью, и большинство из них мертвы задолго до 80 лет, что дает очень небольшую вероятность из них умирают в возрасте 80 лет, в то время как достаточное количество людей в группе А доживает до 80 лет, и значительное число из них умрет в этом возрасте, что приведет к гораздо большей вероятности смерти в этом возрасте. Таким образом, одно и то же утверждение может означать, что пребывание в группе А лучше или хуже, чем в группе В. Что имеет больше смысла, так это сказать, что те люди (в каждой группе), которые жили до 80 лет, в какой пропорции умрут до того, как им исполнится 81 год. Это и есть опасность (а опасность является функцией функции распределения / функции выживания / и т. Д.). С этой опасностью проще работать в полупараметрической модели, которая затем может дать вам информацию о распределении.

— Грег Сноу
источник

7

Хороший ответ. Что уникально во времени, так это то, что оно движется в одном направлении, и как только мы выдержали период высокого риска, мы в основном заинтересованы в действующем риске. Вот что говорит нам функция опасности.

— Фрэнк Харрелл

2

Еще один момент, который стоит добавить, заключается в том, что при цензуре данных проверка предположений о распределении может быть очень сложной. Например, предположим, что только 20% ваших субъектов наблюдают событие. Попытка определить, следуют ли хвосты распределения за распределением Вейбулла, явно невозможна! Модель Cox-PH несколько обходит проблему (но вы должны очень осторожно относиться к предположению о пропорциональных опасностях, если вы хотите экстраполировать на области, которые были подвергнуты сильной цензуре)

— Cliff AB

16

«Мы» не обязательно. Диапазон инструментов анализа выживания варьируется от полностью непараметрического, такого как метод Каплана-Мейера, до полностью параметрических моделей, где вы указываете распределение основной опасности. У каждого есть свои преимущества и недостатки.

Полупараметрические методы, такие как модель пропорциональных рисков Кокса, позволяют вам не указывать основную функцию риска. Это может быть полезно, так как мы не всегда знаем основную функцию опасности и во многих случаях также не заботимся . Например, многие эпидемиологические исследования хотят знать, «Уменьшает ли воздействие X время до события Y»? То, что их волнует, - это разница у пациентов, у которых есть X, и у которых нет X. В этом случае основная опасность на самом деле не имеет значения, и риск ее неправильного определения хуже, чем последствия ее незнания.

Однако бывают случаи, когда это также не соответствует действительности. Я выполнил работу с полностью параметрическими моделями, потому что основная опасность представляла интерес.

— фомиты
источник

1

«... и риск неверного определения этого хуже, чем последствия незнания». Это было очень полезно, спасибо.

Не могли бы вы привести пример, когда основной интерес будет представлять интерес?

— Дан Чалтиэль

1

@DanChaltiel Любая оценка, которая предназначена для включения в математическую модель или тому подобное, может служить примером - основная функция риска там представляет особый интерес.

— Fomite