Как формализовать предыдущее распределение вероятностей? Есть ли практические правила или советы, которые следует использовать?


9

Хотя мне нравится думать, что я хорошо понимаю концепцию предварительной информации в байесовском статистическом анализе и принятии решений, у меня часто возникают проблемы с нахождением головы вокруг ее применения. Я имею в виду пару ситуаций, которые иллюстрируют мою борьбу, и я чувствую, что они не были должным образом рассмотрены в байесовских статистических учебниках, которые я читал до сих пор:

Допустим, я провел опрос несколько лет назад, который говорит, что 68% людей будут заинтересованы в покупке продукта ACME. Я решил снова провести опрос. Хотя я буду использовать тот же размер выборки, что и в прошлый раз (скажем, n = 400), с тех пор мнения людей, вероятно, изменились. Тем не менее, если бы я использовал в качестве предварительной версии бета-версию, в которой 272 из 400 респондентов ответили «да», я бы придал равный вес опросу, который я провел несколько лет назад, и опросу, который я буду проводить сейчас. Существует ли эмпирическое правило, позволяющее установить большую неопределенность, которую я хотел бы придать априорному виду, поскольку этим данным уже несколько лет? Я понимаю, что могу просто уменьшить предыдущее с 272/400, скажем, до 136/200, но это кажется крайне произвольным, и мне интересно, есть ли какая-то форма оправдания, возможно, в литературе,

Для другого примера, скажем, мы собираемся запустить клиническое испытание. Прежде чем приступить к испытанию, мы проводим некоторые дополнительные исследования, которые мы могли бы использовать в качестве предварительной информации, включая мнения экспертов, результаты предыдущих клинических испытаний (различной значимости), другие основные научные факты и т. Д. Как можно объединить этот спектр информации (некоторые из которых не являются количественными по своей природе) до предварительного распределения вероятности? Является ли это просто случаем принятия решения о том, какую семью выбрать и сделать так, чтобы она была достаточно диффузной, чтобы гарантировать, что она будет перегружена данными, или много работы сделано для создания достаточно информативного предварительного распределения?


Ответы:


4

Ваша идея обработать вашу предварительную информацию о 272 успехах в 400 попытках действительно имеет достаточно твердое байесовское обоснование.

θ

π(θ)=Γ(α0+β0)Γ(α0)Γ(β0)θα01(1θ)β01
n_=α0+β02n_α01
π(θ)=Γ(α0+β0)Γ(α0)Γ(β0)θα01(1θ)n_(α01)
α0+β02=400α01=272α0=273β0=129α0=137β0=65
μ=αα+βandσ2=αβ(α+β)2(α+β+1)
alpha01 <- 273
beta01 <- 129
(mean01 <- alpha01/(alpha01+beta01))

alpha02 <- 137
beta02 <- 65
(mean02 <- alpha02/(alpha02+beta02))

но увеличивает предыдущее отклонение от

(priorvariance01 <- (alpha01*beta01)/((alpha01+beta01)^2*(alpha01+beta01+1)))
[1] 0.0005407484

в

(priorvariance02 <- (alpha02*beta02)/((alpha02+beta02)^2*(alpha02+beta02+1)))
[1] 0.001075066

по желанию.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.