Выборка из предельного распределения с использованием условного распределения?


12

Я хочу сделать выборку из одномерной плотности но я знаю только соотношение:еИкс

еИкс(Икс)знак равноеИкс|Y(Икс|Y)еY(Y)dY,

Я хочу избежать использования MCMC (непосредственно на интегральном представлении) и, так как и f Y ( y ) легко выбрать, я подумал об использовании следующего сэмплера:еИкс|Y(Икс|Y)еY(Y)

  1. Для .Jзнак равно1,...,N
  2. Пример .YJ~еY
  3. Образец .ИксJ~еИкс|Y(|YJ)

Тогда, я в конечном итоге с парами , и взять только маргинальные выборки ( x 1 , , x N ) . Это правильно?(Икс1,Y1),,,,,(ИксN,YN)(Икс1,...,ИксN)

Ответы:


10

Да, это правильно. В основном у вас есть

еИкс,Y(Икс,Y)знак равноеИкс|Y(Икс|Y)еY(Y),

и, как вы сказали, вы можете взять образец из плотности сустава. Взяв только из выборок, вы получите выборку из предельного распределения.Икс

Это потому, что акт игнорирования похож на интеграцию по нему. Давайте разберемся с примером.Y

Предположим, = рост матери, а Y = рост дочери. Цель состоит в том, чтобы получить образец из ( X , Y ), чтобы понять связь между высотами дочерей и их матерей. (Я предполагаю, что в семье есть только одна дочь, и ограничиваю население всеми дочерьми старше 18 лет, чтобы обеспечить полный рост).ИксY(Икс,Y)

Вы выходите и получаете репрезентативную выборку

(Икс1,Y1),...,(ИксN,YN),

Таким образом, для каждой матери у вас есть рост их дочери. Там должна быть четкая связь между и Y . Теперь предположим, что из вашего набора данных вы игнорируете все данные о дочерях (отбросьте Y ), тогда что у вас есть? Вы должны точно высота случайно выбранные матерей , которые будут N черпает из маргинальных в X .ИксYYNИкс


Спасибо за это, это полезно. Знаете ли вы, можно ли связать эту стратегию выборки с выборкой Гиббса, чтобы формально обосновать ее?
Род

1
YИксYY

1
Гринпаркер, но есть ли формальное доказательство этого утверждения, т. Е. Рассмотрение только части образца, взятого из сустава, дает образец из маргинального номера?
Старик в море.

Выборка «X = матерей» путем выборки (X, Y) и взятия X фактически дает вам образцы «матерей, у которых точно одна полностью выросшая дочь», что не является тем же, что и «матери». Но даже если мы изменим ваш пример, чтобы сказать, что вы заинтересованы в «X = матерях, у которых есть ровно одна полностью выросшая дочь», при достижении X путем выборки (X, Y) искажается ваша выборка на основе распределения Y. p (v ) = ∑ (u в поддержке (U)) (p (u, v))) = ∑ (u в поддержке (U)) (p (v | u) * p (u))) = (1 / sampleSize ( u)) * ∑ (u в выборке (U)) (p (v | u))), потому что каждое значение u появляется в выборке с вероятностью p (u) - поэтому необходимо усреднить p (v | u) ничья
Радуманолеску
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.