Анализ выживания: непрерывное и дискретное время


20

Я не совсем понимаю, как решить, следует ли считать время непрерывным или дискретным в анализе выживания. В частности, я хочу использовать анализ выживаемости для определения переменных на уровне детей и домохозяйств, которые имеют наибольшее расхождение в их влиянии на выживаемость мальчиков и девочек (до 5 лет). У меня есть набор данных о возрасте ребенка (в месяцах), а также показатель того, жив ли ребенок, возраст смерти (в месяцах) и другие переменные на уровне ребенка и домохозяйства.

Поскольку время записывается в месяцах и все дети моложе 5 лет, существует много связанных периодов выживания (часто с интервалом в пол года: 0 мос, 6 мс, 12 мес и т. Д.). Исходя из того, что я прочитал об анализе выживаемости, наличие множества привязанных времен выживания заставляет меня думать, что я должен относиться ко времени как к дискретному. Тем не менее, я прочитал несколько других исследований, где время выживания, например, в человеко-годах (и, конечно, есть выживающие привязанные времена) и методы непрерывного времени, такие как пропорциональные опасности Кокса, используются.

Какие критерии я должен использовать, чтобы решить, следует ли считать время непрерывным или дискретным? Что касается моих данных и вопросов, то использование некоторой модели с непрерывным временем (Кокс, Вейбулл и т. Д.) Имеет для меня интуитивный смысл, но дискретный характер моих данных и количество связанных периодов выживания, по-видимому, указывают на обратное.

Ответы:


10

При выборе модели выживания следует руководствоваться основным явлением. В этом случае он кажется непрерывным, даже если данные собираются несколько дискретным образом. Разрешение на один месяц было бы хорошо в течение 5 лет. Однако большое количество связей в 6 и 12 месяцев заставляет задуматься, действительно ли у вас есть точность в 1 месяц (ожидаются связи в 0 - это особое значение, когда на самом деле происходит относительно много смертей). Я не совсем уверен, что вы можете с этим поделать, так как это, скорее всего, отражает постфактум, а не интервальную цензуру.


2
Как общее практическое правило, если дискретные данные можно разделить на десять или более частей, их можно рассматривать как непрерывные, даже если они действительно дискретны (выборка один раз в месяц в течение шести месяцев сильно отличается от выборки еженедельно в течение шести месяцев или раз в месяц в течение двух лет). В следующей статье также приводятся некоторые дополнительные идеи в обработке дискретных данных , как непрерывно: theanalysisfactor.com/count-data-considered-continuous
Tavrock

4

Я подозреваю, что если вы используете модели с непрерывным временем, вы захотите использовать интервальную цензуру, отражающую тот факт, что вы не знаете точное время сбоя, а просто интервал, в котором произошел сбой. Если вы подходите для моделей параметрической регрессии с интервальной цензурой с использованием максимального вероятности, связанное время выживания не является проблемой IIRC.


4

В большинстве анализов времена выживания будут связаны, но большие, четкие куски связей на определенных событиях вызывают беспокойство. Я думаю, долго и упорно о самом исследовании, как его сбора данных и т.д.

Поскольку вне некоторых методологических потребностей использовать тот или иной тип времени, то, как вы моделируете выживание, должно зависеть от того, является ли основной процесс дискретным или непрерывным в мире.


1

Если у вас есть ковариаты, которые изменяются со временем для некоторых людей (например, доход семьи может варьироваться в вашем примере в течение жизни ребенка), модели выживания (параметрическая и модель Кокса) требуют, чтобы вы разбили данные на дискретные интервалы, определяемые как переменные ковариаты.

Этот документ лекций немецкого Родригеса мне пригодился.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.