Формула вероятности для многомерного распределения Бернулли


13

Мне нужна формула для вероятности события в n-вариативном распределении Бернулли X{0,1}n с заданными вероятностями P(Xi=1)=pi для одного элемента и для пар элементов P(Xi=1Xj=1)=pij . Эквивалентное я мог бы дать среднее значение и ковариация X .

Я уже узнал, что существует много распределений, имеющих свойства, так же как существует много распределений, имеющих данное среднее значение и ковариацию. Я ищу каноническое значение на { 0 , 1 } n , так же как гауссово является каноническим распределением для R n и заданного среднего значения и ковариации.{0,1}n{0,1}nRn

Ответы:


11

Случайная переменная, принимающая значения в является дискретной случайной величиной. Его распределение полностью описывается вероятностями p i = P ( X = i ) с i{ 0 , 1 } n . Приведенные вами вероятности p i и p i j являются суммами p i для определенных индексов i .{0,1}npi=P(X=i)i{0,1}npipijpii

Теперь кажется, что вы хотите описать , используя только p i и p i j . Это невозможно без принятия определенных свойств на p ipipipijpi . Для того, чтобы увидеть , что попытаться вывести характеристической функции из . Если мы возьмем п = 3, мы получимXn=3

Невозможно переставить это выражение так, чтобыp i

Eei(t1X1+t2X2+t3X3)=p000+p100eit1+p010eit2+p001eit3+p110ei(t1+t2)+p101ei(t1+t3)+p011ei(t2+t3)+p111ei(t1+t2+t3)
pi dissapear. For the gaussian random variable the characteristic function depends only on mean and covariance parameters. Characteristic functions uniquely define distributions, so this is why Gaussian can be described uniquely by using only mean and covariance. As we see for random variable X this is not the case.

 


10

See the following paper:

J. L. Teugels, Some representations of the multivariate Bernoulli and binomial distributions, Journal of Multivariate Analysis, vol. 32, no. 2, Feb. 1990, 256–268.

Here is the abstract:

Multivariate but vectorized versions for Bernoulli and binomial distributions are established using the concept of Kronecker product from matrix calculus. The multivariate Bernoulli distribution entails a parameterized model, that provides an alternative to the traditional log-linear model for binary variables.


2
Thank you for sharing that, Hamed. Welcome to our site!
whuber

1

I don't know what the resulting distribution is called, or if it even has a name, but it strikes me the obvious way to set this up is to think of the model you'd use to model a 2×2×2×…×2 table using a log-linear (Poisson regression) model. As you know the 1st-order interactions only, it's then natural to assume that all higher-order interactions are zero.

Using the questioner's notation, this gives the model:

P(X1=x1,X2=x2,,Xn=xn)=i[pixi(1pi)1xij<i(pijpipj)xixj]

This formula has notational problems: there are p's on the left and the right. The right side makes no reference at all to the subscript i. Furthermore, still interpreting the pi as probabilities (as in the original question), the rhs clearly is positive whereas the lhs cannot be positive.
whuber

@whuber Quite right! I stick by the model I set out in the first para, but my equation was screwed up in several ways... Goes to show I haven't actually used log-linear modelling of contingency tables since my MSc, and I haven't got the notes or books to hand. I believe I've fixed it now though. Let me know if you agree! Apols for the delay. Some days my brain just doesn't do algebra.
onestop

1
I don't think this works. Assume pi=1/n and pij=0ij. This is a valid combination of probabilities, realized when I is a uniform random variable {1,...,n} and XI=1 and all Xj=0jI. Still the formula above would be 0 for all events. Still thanks for helping!
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.