Да, это правильно. В основном у вас есть
еИкс, Y( х , у) = fИкс| Y( х | у) fY( у) ,
и, как вы сказали, вы можете взять образец из плотности сустава. Взяв только из выборок, вы получите выборку из предельного распределения.Икс
Это потому, что акт игнорирования похож на интеграцию по нему. Давайте разберемся с примером.Y
Предположим, = рост матери, а Y = рост дочери. Цель состоит в том, чтобы получить образец из ( X , Y ), чтобы понять связь между высотами дочерей и их матерей. (Я предполагаю, что в семье есть только одна дочь, и ограничиваю население всеми дочерьми старше 18 лет, чтобы обеспечить полный рост).ИксY( Х, Y)
Вы выходите и получаете репрезентативную выборку
( х1, у1) , … , ( XN, уN) .
Таким образом, для каждой матери у вас есть рост их дочери. Там должна быть четкая связь между и Y . Теперь предположим, что из вашего набора данных вы игнорируете все данные о дочерях (отбросьте Y ), тогда что у вас есть? Вы должны точно высота случайно выбранные матерей , которые будут N черпает из маргинальных в X .ИксYYNИкс