Визуализировать двумерное биномиальное распределение


11

Вопрос: как выглядит двумерное биномиальное распределение в трехмерном пространстве?

Ниже приведена конкретная функция, которую я хотел бы визуализировать для различных значений параметров; а именно , и .np1p2

f(x1,x2)=n!x1!x2!p1x1p2x2,x1+x2=n,p1+p2=1.

Обратите внимание, что есть два ограничения; и . Кроме того, является положительным целым числом, скажем, .x1+x2=nn 5p1+p2=1n5

Мы сделали две попытки построить функцию, используя LaTeX (TikZ / PGFPLOTS). При этом я получаю графики ниже для следующих значений: , и , а , и соответственно. Мне не удалось реализовать ограничение на значения домена; , так что я немного озадачен.p 1 = 0,1 p 2 = 0,9 n = 5 p 1 = 0,4 p 2 = 0,6 x 1 + x 2 = nn=5p1=0.1p2=0.9n=5p1=0.4p2=0.6x1+x2=n

Визуализация, произведенная на любом языке, подойдет (R, MATLAB и т. Д.), Но я работаю в LaTeX с TikZ / PGFPLOTS.

Первая попытка

n=5 , ир 2 = 0,9p1=0.1p2=0.9

введите описание изображения здесь

Вторая попытка

n=5 , ир 2 = 0,6p1=0.4p2=0.6

введите описание изображения здесь

Редактировать:

Для справки, вот статья, содержащая некоторые графики. Название статьи: «Новое двумерное биномиальное распределение» Атану Бисвасы и Цзин-Шанга Хванга. Письма о статистике и вероятности 60 (2002) 231–240.

Изменить 2: Для ясности и в ответ на @GlenB в комментариях ниже приведен снимок того, как дистрибутив был представлен мне в моей книге. Книга не относится к вырожденным / невырожденным случаям и так далее. Это просто представляет это так, и я пытался визуализировать это. Ура! Кроме того, как отмечает @JohnK, существует вероятность опечатки в отношении x1 + x1 = 1, которая, по его мнению, должна быть x1 + x1 = n.

введите описание изображения здесь

Изображение уравнения из:

Спанос А. (1986) Статистические основы эконометрического моделирования. Издательство Кембриджского университета


5
Но это не должно быть непрерывным, не так ли? Обе случайные величины являются дискретными.
JohnK

1
Значит, x1 и x2 независимы, верно? Вам нужен псевдо-3D сюжет? Будет ли тепловая карта приемлемой?
gung - Восстановить Монику


2
@JohnK Если и вы имеете дело с (а - просто ). Это одномерный бином (или, считающийся двумерным, он вырожденным ). x1+x2=np1+p2=1X1Binomial(n,p1)X2nX1
Glen_b

3
У вас нет спецификации для двумерного бинома в вашем вопросе. (Существует более одного способа указать двумерное распределение, которое можно было бы назвать «биномиальным». У вас их нет, хотя ваш вырожденный будет частным случаем некоторых из них.) ... рисунки в Ваши ссылки на Biswasa & Hwang не являются подходящими отображениями дискретного двумерного PMF. Короче говоря, вашему вопросу не хватает ничего для рисования, и ваша ссылка полезна в основном как пример того, чего следует избегать.
Glen_b

Ответы:


8

Здесь есть две части: сначала вам нужно выяснить, каковы индивидуальные вероятности, а затем вам нужно как-то построить их.

Биномиальный PMF - это просто набор вероятностей по ряду «успехов». Двумерный биномиальный PMF будет набором вероятностей по сетке возможных комбинаций «успехов». В вашем случае у вас , поэтому (имея в виду, что успехов возможно), есть возможных результатов в сетчатом / двумерном биномиальном распределении. ni=nj=506×6=36

Сначала мы можем вычислить предельные биномиальные PMF, потому что это так просто. Поскольку переменные независимы, каждая совместная вероятность будет просто произведением предельных вероятностей; это матричная алгебра. Здесь я демонстрирую этот процесс, используя Rкод:

b1 = dbinom(0:5, size=5, prob=0.1);  sum(b1)  # [1] 1
b9 = dbinom(0:5, size=5, prob=0.9);  sum(b9)  # [1] 1
b4 = dbinom(0:5, size=5, prob=0.4);  sum(b4)  # [1] 1
b6 = dbinom(0:5, size=5, prob=0.6);  sum(b6)  # [1] 1

b19 = b1%o%b9;  sum(b19)  # [1] 1
rownames(b19) <- colnames(b19) <- as.character(0:5)
round(b19, 6)
#       0        1        2        3        4        5
# 0 6e-06 0.000266 0.004783 0.043047 0.193710 0.348678
# 1 3e-06 0.000148 0.002657 0.023915 0.107617 0.193710
# 2 1e-06 0.000033 0.000590 0.005314 0.023915 0.043047
# 3 0e+00 0.000004 0.000066 0.000590 0.002657 0.004783
# 4 0e+00 0.000000 0.000004 0.000033 0.000148 0.000266
# 5 0e+00 0.000000 0.000000 0.000001 0.000003 0.000006
b46 = b4%o%b6;  sum(b46)  # [1] 1
rownames(b46) <- colnames(b46) <- as.character(0:5)
round(b46, 3)
#       0     1     2     3     4     5
# 0 0.001 0.006 0.018 0.027 0.020 0.006
# 1 0.003 0.020 0.060 0.090 0.067 0.020
# 2 0.004 0.027 0.080 0.119 0.090 0.027
# 3 0.002 0.018 0.053 0.080 0.060 0.018
# 4 0.001 0.006 0.018 0.027 0.020 0.006
# 5 0.000 0.001 0.002 0.004 0.003 0.001

На данный момент мы имеем две необходимые матрицы вероятностей. Нам просто нужно решить, как мы хотим построить их. Если честно, я не большой поклонник 3D-графиков. Поскольку, Rкажется, согласен со мной, я сделал эти графики в Excel:

b19:

введите описание изображения здесь

b46:

введите описание изображения здесь


Спасибо за презентацию плюс код R Это заставляет меня спросить о x1 + x2 = n. Если это условие выполнено, должна ли быть только одна линия столбов, как представлено здесь: reference.wolfram.com/language/ref/MultinomialDistribution.html Граф вольфрама, который я предполагаю, это то, что @Glen_b назвал вырожденным случаем? Значит ли это, что вы представили невырожденный случай?
Грэм Уолш

1
GraemeWalsh, моя презентация не показывает двумерный бином, где x1 + x2 = n. Как @Glen_b подробно обсуждалось в комментариях и его ответе, я бы не стал называть это «двумерным биномиальным распределением» без его квалификации. Более того, это будет означать, что x1 и x2 не являются независимыми, как вы сказали в своем ответном комментарии, но совершенно зависимы. По правде говоря, я не заметил, что это был такой странный вариант (вы можете обвинить меня в том, что я недостаточно внимательно читал). Как показал Glen_b, эта версия будет представлять собой одну линию столбов. То, что я представил, было невырожденным случаем.
gung - Восстановить Монику

@ Gung Мне нравятся твои новые сюжеты. Я думаю, что ваше обсуждение очень хорошо охватывает вырожденный случай («вам нужно выяснить, каковы индивидуальные вероятности», на самом деле все сказано; фактические вычисления для вырожденного случая тривиальны); Я только что выполнил эти тривиальные вычисления.
Glen_b

7

Ответ Ганга - хороший ответ для фактического двумерного бинома, хорошо объясняющий проблемы (я бы рекомендовал принять его как хороший ответ на заглавный вопрос, который, скорее всего, будет полезен для других).

Математический объект, который вы фактически представляете в своем редактировании, на самом деле является одномерным масштабированным биномом. Здесь - это не значение, взятое из числа биномов, а из пропорции (бином, деленный на ).x1n

Итак, давайте определимся правильно. Обратите внимание, что определение случайной величины фактически не предлагается, поэтому у нас осталось немного догадок.

Y1binomial(n,p1),P(Y1=y1)y1y1=0,1,...,nX1=Y1/nx1=0,16,26,...,1

P(X1=x1)x2=nx1p2=1p1

Для , это выглядит так:n=6,p1=0.3

введите описание изображения здесь

Мы можем легко поместить значения на приведенный выше график, просто поместив второй набор меток под значениями равными (возможно, другого цвета), чтобы указать значение, принятое .х 1 1 - х 1 х 2x2x11x1x2

Мы можем рассматривать его как (масштабированный) вырожденный двумерный бином:

введите описание изображения здесь

но довольно сложно назвать то, что определено в книге, двумерным биномом (поскольку это фактически одномерный бином).

Предполагая, что кто-то захочет сгенерировать график, подобный трехмерному, этот небольшой фрагмент кода (R) будет довольно близок ко второму графику выше:

y = 0:6
x1 = y/6
x2 = 1-x1
p = dbinom(y,6,.3)
scatterplot3d(x1,x2,p,grid=TRUE, box=FALSE, cex.lab=1.2,
        color=3, cex.main=1.4,pch=21,bg=1,, type="h",angle=120,
        main="degenerate scaled binomial", ylab="x2", xlab="x1", 
        zlab="prob")

(Вам нужен scatterplot3dпакет, который содержит функцию с тем же именем.)

«Истинный» (невырожденный) двумерный бином имеет вариацию в обеих переменных одновременно. Вот пример одного конкретного вида двумерного бинома (в данном случае не независимого). Я использовал разные цвета на графике, потому что иначе слишком легко заблудиться в лесу «палок».

введите описание изображения здесь

Xbin(n0,p)Ybin(ny,p)Zbin(nz,p)X1=X+YX2=X+Z

X1X2

n0nynz=Xx1=x2x1+x2=n

[1]: Хамдан, М.А. (1972),
"
Международное статистическое обозрение " Каноническое расширение двумерного биномиального распределения с неравными краевыми индексами " , 40 : 3 (декабрь), с. 277-280.


corr(X1,X2)=1

Glen_b. Большое спасибо. Указание на то, что математический объект, который я представил (который был подарен мне!), Является (масштабированным) вырожденным двумерным биномом , было очень полезно! Я не знал этого с самого начала. Наконец, элементарный запрос! Возможно ли для вас быть явным (посредством математической записи) о том, как вы определяете истинный или фактический двумерный бином? Это было бы полезно, я думаю.
Грэм Уолш

1
Xbin(n0,p)Ybin(ny,p)Zbin(nz,p)X1=X+YX2=X+Z

1
X1X2

@ Грэм ... Я планирую добавить еще несколько деталей.
Glen_b

4

Mathematicaсейчас достаточно силен в таких вещах - у него есть решение вашей проблемы прямо в документации . С небольшими дополнениями я сделал модель для игры ( p = p1 = 0.4для лучшего визуального представления). Так выглядит интерфейс и как им можно управлять.

введите описание изображения здесь

отрывок

Manipulate[
 Grid[{
   {DiscretePlot3D[
     PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right],

    DiscretePlot3D[
     CDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right]}
   }]
 ,
 {{n, 5}, 1, 20, 1, Appearance -> "Labeled"},
 {{p, 0.4}, 0.1, 0.9},
 TrackedSymbols -> True
 ]

Главное здесь PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], я думаю, самоочевидно. Multinomialпросто имейте в виду, что вы можете взять много распределений с каждым piдля соответствующей переменной. Простая форма есть BinomialDistribution. Конечно, я мог бы сделать это вручную, но правило, если у вас есть встроенная функция - вы должны использовать ее.

Если вам нужны комментарии по структуре кода, просто дайте мне знать.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.