Если вы знаете параметрическое распределение, которому следуют ваши данные, используйте подход максимального правдоподобия, и распределение имеет смысл. Реальное преимущество регрессии Пропорциональных рисков Кокса состоит в том, что вы все еще можете соответствовать моделям выживания, не зная (или не предполагая) распределение. Вы привели пример с использованием нормального распределения, но большинство времен выживания (и других типов данных, для которых используется регрессия Кокса PH) не приближаются к нормальному распределению. Некоторые могут следовать логарифмически нормальному, или вейбулловскому, или другому параметрическому распределению, и если вы готовы сделать такое предположение, тогда параметрический подход с максимальной вероятностью велик. Но во многих случаях реального мира мы не знаем, каково соответствующее распределение (или даже достаточно близкое приближение). С цензурой и ковариатами мы не можем сделать простую гистограмму и сказать «это похоже на… распределение для меня». Поэтому очень полезно иметь технику, которая работает хорошо, без необходимости конкретного распределения.
Зачем использовать опасность вместо функции распределения? Рассмотрим следующее утверждение: «Люди в группе A в два раза чаще умирают в возрасте 80 лет, чем люди в группе B». Теперь это может быть правдой, потому что люди в группе B, как правило, живут дольше, чем люди в группе A, или это может быть потому, что люди в группе B, как правило, живут более короткой жизнью, и большинство из них мертвы задолго до 80 лет, что дает очень небольшую вероятность из них умирают в возрасте 80 лет, в то время как достаточное количество людей в группе А доживает до 80 лет, и значительное число из них умрет в этом возрасте, что приведет к гораздо большей вероятности смерти в этом возрасте. Таким образом, одно и то же утверждение может означать, что пребывание в группе А лучше или хуже, чем в группе В. Что имеет больше смысла, так это сказать, что те люди (в каждой группе), которые жили до 80 лет, в какой пропорции умрут до того, как им исполнится 81 год. Это и есть опасность (а опасность является функцией функции распределения / функции выживания / и т. Д.). С этой опасностью проще работать в полупараметрической модели, которая затем может дать вам информацию о распределении.