Шаги, чтобы выяснить апостериорное распределение, когда может быть достаточно просто иметь аналитическую форму?


12

Это также спросили в вычислительной науке.

Я пытаюсь вычислить байесовскую оценку некоторых коэффициентов для авторегрессии с 11 выборками данных:

Yi=μ+αYi1+ϵi
гдеϵi является гауссовым со средним 0 и дисперсиейσe2 априорное распределение на векторе(μ,α)t является гауссовым со средним(0,0) и диагональной ковариационной матрицы с диагональными элементами равны доσp2 .

Исходя из формулы авторегрессии, это означает, что распределение точек данных ( Yi ) является нормальным со средним μ+αYi1 и дисперсияσe2 . Таким образом, плотность для всех точек данных(Y) совместно (при условии независимости, что хорошо для программы, которую я пишу), будет:

p(Y|(μ,α)t)=i=21112πσe2exp(YiμαYi1)22σe2.

По теореме Байеса мы можем взять произведение вышеуказанной плотности с предыдущей плотностью, и тогда нам просто понадобится нормализующая константа. Я предполагаю, что это должно быть гауссовским распределением, поэтому мы можем беспокоиться о нормализующей константе в конце, а не явно вычислять ее с интегралами по и α .μα

Это часть, с которой у меня проблемы. Как вычислить умножение предыдущей плотности (которая является многомерной) и этот продукт одномерных плотностей данных? Апостериор должен быть просто плотностью и α , но я не могу понять, как вы получите это из такого продукта.μα

Любые указатели действительно полезны, даже если вы просто указываете мне правильное направление, а затем мне нужно пойти и заняться грязной алгеброй (это то, что я уже пытался несколько раз).

В качестве отправной точки, вот форма числителя из правила Байеса:

1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2].

Вопрос состоит в том, как увидеть, что это приводит к гауссовой плотности .(μ,α)t

добавленной

В конечном итоге это сводится к следующей общей проблеме. Если задано некоторое квадратичное выражение, как М 2 + B ц & alpha ; + C & alpha ; 2 + J ц + K α + L Как вы положить , что в квадратичной форме ( μ - ц , & alpha ; - & alpha ;

Aμ2+Bμα+Cα2+Jμ+Kα+L
для некоторого 2х2 матрицы Q(μμ^,αα^)Q(μμ^,αα^)tQ? Это достаточно просто в легких случаях, но какой процесс вы используете , чтобы получить средние и альфа ?μ^α^

Обратите внимание, я попробовал простой вариант расширения формулы матрицы, а затем попытался приравнять коэффициенты, как указано выше. Проблема, в моем случае, состоит в том, что константа равна нулю, и тогда я в итоге получаю три уравнения с двумя неизвестными, поэтому она недостаточно определена, чтобы просто соответствовать коэффициентам (даже если я приму матрицу симметричной квадратичной формы).L


Мой ответ на [этот вопрос] ( stats.stackexchange.com/questions/22852/… ) может быть полезным. Обратите внимание, что вам нужен предварительный просмотр для вашего первого наблюдения - итерации на этом заканчиваются.
вероятностная

Я не понимаю, зачем мне это нужно в этом случае. Я должен относиться к временным интервалам так, как будто они условно независимы, учитывая наблюдения. Обратите внимание на то, что произведение плотности суставов только от . Я не думаю, что я должен получить здесь последовательно обновляемую формулу, только одну формулу для апостериорного p ( ( μ , α ) ti=2..11 . p((μ,α)t|Y)
Ely

«Многофакторный» в предшествующем не противоречит «одномерному» в плотностях данных, потому что они являются плотностями в y i . p(α,μ)yi
Сиань

Ответы:


7

Подсказка, которая была в моем ответе на предыдущий ответ, состоит в том, чтобы посмотреть, как я интегрировал параметры - потому что вы будете делать точно такие же интегралы здесь. Ваш вопрос предполагает известные параметры дисперсии, поэтому они являются константами. Вам нужно только посмотреть на зависимость от числителя. Чтобы увидеть это, обратите внимание, что мы можем написать:α,μ

= 1

p(μ,α|Y)=p(μ,α)p(Y|μ,α)p(μ,α)p(Y|μ,α)dμdα
=1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2]1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2]dμdα

Обратите внимание, как мы можем вытащить первый фактор из двойного интеграла по знаменателю, и он отменяется с помощью числителя. Мы также можем вытащить сумму квадратовexp [ -11(2πσe2)52πσp2и он также будет отменен. Интеграл, с которым мы остались, теперь (после расширения квадрата):exp[12σe2i=211Yi2]

=exp[10μ2+α2i=110Yi22μi=211Yi2αi=211YiYi1+2μαi=110Yi2σe2μ22σp2α22σp2]exp[10μ2+α2i=110Yi22μi=211Yi2αi=211YiYi1+2μαi=110Yi2σe2μ22σp2α22σp2]dμdα

Теперь мы можем использовать общий результат из обычного PDF.

Это следует из заполнения квадрата на-az2+bzи того, чтоcне зависит отz. Отметим, что внутренний интеграл поµимеет видa=10

exp(az2+bzc)dz=πaexp(b24ac)
az2+bzczμ иб=Σ 11 я = 2 Yя-αЕ 10 я = 1 Yяa=102σe2+12σp2 ис=α2Σ 10 я = 1 Y 2 я -2αЕ 11 я = 2 YяYя-1b=i=211Yiαi=110Yiσe2 . Выполнив этот интеграл, вы обнаружите, что оставшийся интеграл поαтакже имеет эту форму, поэтому вы можете снова использовать эту формулу с другимa,b,c. Тогда вы должны быть в состоянии написать свой апостериорный в форме1c=α2i=110Yi22αi=211YiYi12σe2+α22σp2αa,b,cгдеV12π|V|12exp[12(μμ^,αα^)V1(μμ^,αα^)T]V представляет собой матрицы2×2

Дайте мне знать, если вам нужно больше подсказок.

Обновить

(примечание: правильная формула, должно быть 10μ2 вместо )μ2

если мы посмотрим на квадратичную форму, которую вы написали в обновлении, мы заметим, что есть коэффициентов ( L не имеет значения для апостериорных, поскольку мы всегда можем добавить любую константу, которая будет отменена в знаменателе). Мы также имеем 5 неизвестных ц , & alpha ; , Q 11 , Q 12 = Q 21 , Q 22 . Следовательно, это «хорошо поставленная» задача, если уравнения линейно независимы. Если разложить квадратные ( М - М , & alpha ; - & alpha ; ) Q5L5μ^,α^,Q11,Q12=Q21,Q22 получим:(μμ^,αα^)Q(μμ^,αα^)t

= Q 11 ц 2 + 2 Q 21 ц & alpha ; + В 22 & alpha ; 2 - ( 2 Q 11 μ + 2

Q11(μμ^)2+Q22(αα^)2+2Q12(μμ^)(αα^)
+ Q 11 ц 2 + Q 22 & alpha ; 2 + 2 Q 12 ц & alpha ;
=Q11μ2+2Q21μα+Q22α2(2Q11μ^+2Q12α^)μ(2Q22α^+2Q12μ^)α+
+Q11μ^2+Q22α^2+2Q12μ^α^

A=Q11,B=2Q12,C=Q22α^,μ^Q

(2ABB2C)(μ^α^)=(JK)

Таким образом, оценки определяются как:

(μ^α^)=(2ABB2C)1(JK)=14ACB2(BK2JCBJ2KA)

4ACB2

A=102σe2+12σp2B=i=110Yiσe2C=i=110Yi22σe2+12σp2J=i=211Yiσe2K=i=211YiYi1σe2

Xi=Yi1i=2,,11σp2μ,αα^=i=211(YiY¯)(XiX¯)i=211(XiX¯)2μ^=Y¯α^X¯Y¯=110i=211YiX¯=110i=211Xi=110i=110Yi(0,0) .


Это не особенно полезно, потому что я специально упомянул, что здесь важен не знаменатель. Знаменатель - это просто нормализующая константа, которая станет очевидной, как только вы уменьшите числитель до гауссовой формы. Таким образом, уловки для оценки интегралов в знаменателе математически действительно круты, но просто не нужны для моего приложения. Единственная проблема, с которой мне нужно решить, это манипулирование числителем.
Ely

(α,μ)

@ems - вычисляя нормирующую постоянную, вы построите требуемую квадратичную форму. он будет содержать условия, необходимые для заполнения квадрата
вероятностная

(μ^,α^)t

Огромное спасибо за подробное дополнение. Я делал глупые ошибки, пытаясь вычислить алгебру, чтобы выяснить квадратичную форму. Ваши комментарии об отношении к оценщику OLS также очень интересны и ценятся. Я думаю, что это ускорит мой код, потому что я буду в состоянии рисовать образцы из аналитической формы, которая имеет встроенные оптимизированные методы. Мой первоначальный план состоял в том, чтобы использовать Метрополис-Гастингс для выборки из этого, но это было очень медленно. Благодарность!
Ely
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.