р2(описано в другом ответе), что это очень зависит от цензурного распространения ваших данных. Другие естественные вещи, которые вы можете посмотреть, такие как отношение правдоподобия к нулевой модели, также имеют эту проблему. (Это в основном потому, что вклад цензурированной точки данных в вероятность очень отличается от вклада точки данных, где наблюдается событие, потому что один из них взят из PDF, а один из CDF.) Различные исследователи Предлагаемые способы обойти это, но те, которые я видел, обычно требуют от вас модели цензурного распределения или чего-то столь же непрактичного. Я не изучал, насколько плоха эта зависимость на практике, поэтому, если ваша цензура довольно мягкая, вы все равно можете посмотреть статистику на основе отношения правдоподобия. Для моделей выживания CART,
τтакже менее чувствительна, чем приведенная выше статистика, поэтому вы можете не выбирать между моделями на ее основе, если разница между ними невелика; он более полезен в качестве интерпретируемого показателя общей производительности, чем способ сравнения различных моделей.
(Наконец, конечно, если у вас есть конкретная цель для моделей - то есть, если вы знаете, какова ваша функция прогнозирования потерь - вы всегда можете оценить их в соответствии с функцией потерь! Но я угадываю вас » не так повезло ...)
Для более глубокого обсуждения статистики отношения правдоподобия и Harrell c , вы должны взглянуть на превосходный учебник Harrell по стратегиям регрессионного моделирования . Раздел по оценке моделей выживания - § 19.10, с. 492-493. Извините, я не могу дать вам однозначного ответа, но я не думаю, что это решенная проблема!