Пропорциональность используется для упрощения анализа
Байесовский анализ обычно делается с помощью еще более простого изложения теоремы Байеса, где мы работаем только с точки зрения пропорциональности по отношению к интересующему параметру. Для стандартной модели IID с плотностью выборки мы можем выразить это как:f(X|θ)
p(θ|x)∝Lx(θ)⋅p(θ)Lx(θ)∝∏i=1nf(xi|θ).
Это утверждение байесовского обновления работает с точки зрения пропорциональности по отношению к параметру . Он использует два упрощения пропорциональности: одно при использовании функции правдоподобия (пропорциональной плотности выборки) и одно сзади (пропорционально произведению правдоподобия и предшествующего значения). Поскольку апостериор является функцией плотности (в непрерывном случае), тогда нормирующее правило устанавливает мультипликативную константу, необходимую для получения действительной плотности (то есть, чтобы она интегрировалась в единицу).θ
Этот метод использования пропорциональности имеет то преимущество, что позволяет нам игнорировать любые мультипликативные элементы функций, которые не зависят от параметра . Это имеет тенденцию упрощать проблему, позволяя нам смести ненужные части математики и получить более простые утверждения механизма обновления. Это не математическое требование (поскольку правило Байеса работает и в непропорциональной форме), но оно упрощает наш мозг для крошечных животных.θ
Прикладной пример: рассмотрим модель IID с данными наблюдений . Для облегчения нашего анализа мы определяем статистику и , которые являются первыми двумя образцами моментов. Для этой модели у нас есть плотность выборки:X1,...,Xn∼IID N(θ,1)x¯=1n∑ni=1xix¯¯=1n∑ni=1x2i
f(x|θ)=∏i=1nf(xi|θ)=∏i=1nN(xi|θ,1)=∏i=1n12π−−√exp(−12(xi−θ)2)=(2π)n/2exp(−12∑i=1n(xi−θ)2).=(2π)n/2exp(−n2(θ2−2x¯θ+x¯¯))=(2π)n/2exp(−nx¯¯2)⋅exp(−n2(θ2−2x¯θ))
Теперь мы можем напрямую работать с этой плотностью выборки, если захотим. Но обратите внимание, что первые два члена в этой плотности являются мультипликативными константами, которые не зависят от . Раздражает необходимость отслеживать эти термины, поэтому давайте просто избавимся от них, поэтому у нас есть функция правдоподобия:θ
Lx(θ)=exp(−n2(θ2−2x¯θ)).
Это немного упрощает ситуацию, так как нам не нужно отслеживать дополнительный термин. Теперь мы можем применить правило Байеса, используя его полную версию уравнения, включая интегральный знаменатель. Но опять же, это требует, чтобы мы отслеживали другую раздражающую мультипликативную константу, которая не зависит от (больше раздражает, потому что мы должны решить интеграл, чтобы получить ее). Итак, давайте просто применим правило Байеса в его пропорциональной форме. Используя сопряженный априорный с некоторым известным параметром точности , мы получаем следующий результат ( заполнив квадрат ):θθ∼N(0,λ0)λ0>0
p(θ|x)∝Lx(θ)⋅p(θ)=exp(−n2(θ2−2x¯θ))⋅N(θ|0,λ0)∝exp(−n2(θ2−2x¯θ))⋅exp(−λ02θ2)=exp(−12(nθ2−2nx¯θ+λ0θ2))=exp(−12((n+λ0)θ2−2nx¯θ))=exp(−n+λ02(θ2−2nx¯n+λ0θ))∝exp(−n+λ02(θ−nn+λ0⋅x¯)2)∝N(θ∣∣nn+λ0⋅x¯,n+λ0).
Итак, из этой работы мы видим, что апостериорное распределение пропорционально нормальной плотности. Поскольку задняя часть должна быть плотной, это означает, что задняя часть является той нормальной плотностью:
p(θ|x)=N(θ∣∣nn+λ0⋅x¯,n+λ0).
Следовательно, мы видим, что апостериорный параметр обычно распределен с апостериорным средним и дисперсией, определяемой как:θ
E(θ|x)=nn+λ0⋅x¯V(θ|x)=1n+λ0.
Теперь полученное нами апостериорное распределение имеет константу интегрирования по фронту (которую мы легко можем найти, посмотрев на форму нормального распределения ). Но обратите внимание, что нам не нужно было беспокоиться об этой мультипликативной константе - вся наша работа удаляла (или вводила) мультипликативные константы всякий раз, когда это упрощало математику. Тот же самый результат может быть получен при отслеживании мультипликативных констант, но это намного сложнее.