Вариационный вывод, дивергенция KL требует истинного


12

По моему (очень скромному) пониманию вариационного вывода, каждый пытается приблизить неизвестное распределение , найдя распределение q, которое оптимизирует следующее:pq

KL(p||q)=xp(x)logp(x)q(x)

Всякий раз, когда я вкладываю время в понимание вариационного вывода, я продолжаю придерживаться этой формулы и не могу не чувствовать, что упускаю суть. Кажется, мне нужно знать , чтобы вычислить K L ( p | | q ) . Но весь смысл был в том, что я не знал этого распределения с .pKL(p||q)p

Именно этот момент меня беспокоит каждый раз, когда я пытаюсь прочитать что-то вариативное. Что мне не хватает?

РЕДАКТИРОВАТЬ :

Я добавлю несколько дополнительных комментариев здесь в результате ответа @wij, я попытаюсь быть более точным.

В случаях, которые меня интересуют, действительно кажется вполне разумным считать, что имеет место следующее;

p(θ|D)=p(D|θ)p(θ)p(D)p(D|θ)p(θ)

pp(D|θ)p(θ)qKL(p(θ|D)||q)p(D|θ)p(θ)

KL

Ответы:


7

p

Y={yi}i=1np(x|Y)p(y|x)p(x)xRd

p(x|Y)=p(x)p(Y)p(Y|x)=p(x)p(Y)i=1np(yi|x).

p(x|Y)p(Y)p(y|x)p(x|Y)

qargminqKL(p||q)pqqQ={i=1dqi(xi)each qi is a one-dimensional Gaussian}q

qiexp(Ejiqjlogp(x,Y)),

гдеТочная формула не имеет большого значения. Дело в том, что приблизительное можно найти, опираясь на знание истинного и допущения в форме, которую должен принять приближенный .p(x,Y)=p(x)i=1np(yi|x).qpq

Обновить

Ниже приводится ответ на обновленную часть вопроса. Я только что понял, что думаю о . Я всегда буду использовать для истинного количества и для приблизительного. В вариационном выводе или вариационном байесовском уравнении определяется какKL(q||p(x|Y))pqq

q=argminqQKL(q||p(x|Y)).

С набором ограничений как указано выше, решение является тем, которое было дано ранее. Теперь, если вы думаете оQ

q=argminqQKL(p(x|Y)||q),

для определенного как подмножество экспоненциального семейства, этот вывод называется распространением ожидания (EP). Решение для в этом случае таково, что его моменты совпадают моментами . q p ( x | Y )Qqp(x|Y)

В любом случае, вы правы, говоря, что по сути вы пытаетесь аппроксимировать истинное апостериорное распределение в смысле KL распределением ограниченным в некоторой форме.q


Я не могу спорить с этим. Я думаю, что большинство объяснений, включая мой собственный глянец по этому поводу.
Педар Койл
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.