Байесовский анализ выживания: пожалуйста, напишите мне априор для Kaplan Meier!


20

Рассмотрим наблюдения, прошедшие цензуру справа, с событиями в моменты времени t1,t2, . Число восприимчивых людей в момент времени i равно ni , а количество событий в момент времени i равно di .

Оценка Каплана-Мейера или продукта возникает естественным образом как MLE, когда функция выживания является ступенчатой ​​функцией S(t)=i:ti<tαi . Правдоподобия , то

L(α)=i(1αi)diαinidi
и MLE является α я = 1 - д яα^i=1dini .

Хорошо, теперь предположим, что я хочу перейти на байесовский. Мне нужен какой-то "естественный" априор, с которым я буду умножать , верно?L(α)

Погуглив очевидные ключевые слова, я обнаружил, что процесс Дирихле является хорошим предшественником. Но, насколько я понимаю, это также априор по точкам разрыва ?ti

Это, безусловно, очень интересно, и мне не терпится узнать об этом, но я бы согласился на что-то попроще. Я начинаю подозревать, что это не так просто, как я сначала подумал, и пришло время попросить вашего совета ...

Спасибо заранее!

PS: Несколько точных сведений о том, что я надеюсь, меня заинтересуют (как можно более простыми) объяснениями о способе обработки процесса Дирихле до этого, однако я думаю, что можно просто использовать априор для - то есть до шага по функциям с разрывами по t i .αiti

Я думаю , что «глобальная форма» из ступенчатых функций , отобранных в предшествующем не должны зависит от «ы - должна быть основным семейством непрерывных функций , которые аппроксимируются этими ступенчатыми функциями.ti

Я не знаю, должен ли быть независимым (я сомневаюсь в этом). Если они, я думаю , что это означает , что до α я зависит от А т I = т I - т я - 1 , и если мы будем обозначать его распределение по А ( Δ т ) , то произведение A ( Δ 1 ) переменная независимой переменной A ( Δ 2 ) является A ( Δ 1 + Δ 2 )αiαiΔti=titi1A(Δt)A(Δ1)A(Δ2)A(Δ1+Δ2)переменная. Кажется , здесь логарифмически переменные могут быть полезны.Γ

Но вот в принципе я застрял. Я не набрал это сначала, потому что не хотел направлять все ответы в этом направлении. Я был бы особенно признателен за ответы с библиографическими ссылками, которые помогут мне обосновать мой окончательный выбор.


В , чтомя? Это опечатка? Вы имеетевидупя? a^i=1dimimini
Стачира

Да, это , конечно. Я исправляю ni
Элвис

1
На этой слайде я нашел эту статью , автор которой также имеет это введение . Если их не будет достаточно в качестве источников, их собственные ссылки, скорее всего, будут. Также это видео о иерархических процессах Дирихле.
Шон Пасха

Обратите внимание, что я понимаю основные характеристики DP, но я не понимаю, как использовать его, конкретно, в качестве предварительного ... Кроме того, с какой базовой мерой и т. Д.
Elvis

Эта функция правдоподобия уникальна? Или вы можете получить КМ из других вероятностей?
вероятностная

Ответы:


11

Обратите внимание, что поскольку ваша функция правдоподобия является продуктом функций данные говорят вам, что нет никаких доказательств корреляции между ними. Обратите внимание, что переменные d i уже масштабируются для учета времени. Более длительный период времени означает больше шансов для событий, как правило, означает больший d i .αididi

Наиболее простой способ «перейти на байесовский» здесь - использовать независимые однородные априорные значения . Обратите внимание, что 0 < α i < 1, так что это правильный априор, следовательно, апостериорный также является правильным. Апостериор является независимым бета-распределением с параметрами p ( α i ) b e t a ( n i - d i + 1 , d i + 1 )p(αi)=10<αi<1p(αi)beta(nidi+1,di+1), Это можно легко смоделировать для генерации апостериорного распределения кривой выживания, используя, например, rbeta ()функцию в R.

Я думаю, что это касается вашего основного вопроса о «более простом» методе. Ниже приведены только идеи создания лучшей модели, которая сохраняет гибкую форму КМ для функции выживания.

Я думаю, что главная проблема с кривой КМ заключается в функции выживания, а не в предыдущем. Например, почему значения должны соответствовать наблюдаемым моментам времени? Разве не имеет смысла размещать их в точках, соответствующих значимым временам событий, основанным на фактическом процессе? Если наблюдаемые моменты времени находятся слишком далеко друг от друга, кривая КМ будет «слишком гладкой». Если они находятся слишком близко, кривая КМ будет «слишком грубой» и потенциально может иметь резкие изменения. Один из способов справиться с «слишком грубой» проблемой - поместить коррелированный априор в α так , чтобы α iα i + 1tiααiαi+1, Эффект этого предварительного будет заключаться в том, чтобы сжать близлежащие параметры ближе друг к другу. Вы можете использовать это в пространстве «log-odds» ηi=log(αi1αi)ητ(ηiηi1)2ni,dii(t0,t1)(t00,t01,t02,t10)n02,n10,d01,d02,d10 but only n1=n01 and d1=d01+d02+d10. So you would probably need to add these "missing data" and use an EM algorithm or perhaps VB (provided you're not going down the mcmc path).

Hope this gives you a start.


Thanks for your thoughts (+1). I was using the uniform prior and I think I will keep that... My real problem is more complicated that the one exposed here, I have correlations between the αi's. This "random walk prior" in intriguing, I’ll have a look.
Elvis

5

For readers facing the problem of going to Bayesian for estimating survival functions accepting right censoring, I would recommend the nonparametric Bayesian approach developed by F Mangili, A Benavoli et al. The only prior specification is a (precision or strength) parameter. It avoids the need to specify the Dirichlet process in case of lack of prior information. The authors propose (1) - a robust estimator of the survival curves and its credible intervals for the probability of survival (2) - A test in the difference of survival of individuals from 2 independent populations which presents various benefits over the classical log rank test or other nonparametric tests. See the R package IDPsurvival and this reference: Reliable survival analysis based on the Dirichlet process. F Mangili et al. Biometrical Journal. 2014.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.