Как получить выборку Гиббса?


11

Я на самом деле стесняюсь спросить об этом, потому что боюсь, что меня будут перенаправлять на другие вопросы или на Википедию о выборке Гиббса, но у меня нет ощущения, что они описывают то, что под рукой.

При заданной условной вероятности : p(x|y)

p(x|y)y=y0y=y1x=x01426x=x13446

И условная вероятность : p(y|x)

p(y|x)y=y0y=y1x=x01323x=x13747

Мы можем однозначно придумать совместную вероятность :funique=p(x,y)

p(x,y)y=y0y=y1p(x)x=x0a0a1c0x=x1a2a3c1p(y)b0b1

Потому что, хотя у нас есть неизвестных, у нас есть больше ( ) линейных уравнений:842+3

a0+a1+a2+a3=1b0+b1=1c0+c1=1

Также как и:

14b0=a034b0=a226(1b0)=a146(1b0)=a313c0=a023c0=a137(1c0)=a247(1c0)=a3

Это быстро решается с помощью , . А именно, приравнивая к . Это дает а остальное следует.c0=34b023c0=a124b0=a126(1b0)=a1b0=25

p(x,y)y=y0y=y1p(x)x=x0110210310x=x1310410710p(y)410610

Итак, теперь мы переходим к непрерывному случаю. Можно вообразить интервалы и держать вышеупомянутую структуру в такте (с большим количеством уравнений, чем неизвестных). Однако что происходит, когда мы переходим к (точечным) экземплярам случайных величин? Как работает выборка

xap(x|y=yb)ybp(y|x=xa)

итеративно, привести к ? Эквивалентно ограничению , как это обеспечивает например? Аналогично с . Можем ли мы записать ограничения и извлечь выборку Гиббса из первых принципов?p(x,y)a0+a1+a2+a3=1XYp(x,y)dydx=1Yp(y|x)dy=1

Итак, меня не интересует, как выполнить выборку Гиббса, что просто, но меня интересует, как ее получить и, предпочтительно, как доказать, что она работает (вероятно, при определенных условиях).

Ответы:


9

Вычисление совместного распределения из условных распределений вообще очень сложно. Если условные распределения выбираются произвольно, общее совместное распределение может даже не существовать. В этом случае даже показать, что условные распределения согласованы, как правило, сложно. Одним из результатов, который можно использовать для получения совместного распределения, является лемма Брука , выбрав фиксированное состояние , хотя я никогда не использовал его самостоятельно для этой цели. Более подробно на эту тему я бы посмотрел на работу Джулиана Бесага.

p(x)p(x)=ip(xix<i,x>i)p(xix<i,x>i),
x

Однако, чтобы доказать, что выборка Гиббса работает, лучше выбрать другой маршрут. Если цепь Маркова, реализованная алгоритмом выборки, имеет распределение качестве инвариантного распределения и является неприводимым и апериодическим , то цепь Маркова будет сходиться к этому распределению (Tierney, 1994) .p

Выборка Гиббса всегда оставляет инвариант совместного распределения, из которого были получены условные распределения: грубо, если и мы производим выборку , тогда(x0,y0)p(x0,y0)x1p(x1y0)

(x1,y0)p(x0,y0)p(x1y0)dx0=p(x1y0)p(y0)=p(x1,y0).

То есть, обновление путем условной выборки не меняет распределение выборки.x

Однако выборка Гиббса не всегда неприводима . Несмотря на то, что мы всегда можем применить его, не нарушая ничего (в том смысле, что если у нас уже есть выборка из желаемого распределения, это не изменит распределение), то от совместного распределения зависит, действительно ли выборка Гиббса сходится к нему (достаточно просто Условием неприводимости является то, что плотность всюду положительна, ).p(x)>0


Интересная проблема по совместимости. Сейчас я проверяю «Совместимость конечных дискретных условных распределений» (Song et al.), Которые используют «матрицу отношений» для установления совместимости и уникальности. Таким образом, Гиббс не может быть выведен из этих ограничений, потому что они не применяются с самого начала. Я могу предположить, что это могло бы возвратить некоторое неправильное совместное распределение (сумма> 1), если условные распределения несовместимы, например. Как-то, однако, у меня есть ощущение, что то, что я делаю, является чем-то детерминированным, чем-то похожим на преобразование Радона. Выборка Гиббса выглядит такой ... грязной.
Энн ван Россум
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.