Каково распределение вероятностей этой случайной суммы неидеальных переменных Бернулли?


9

Я пытаюсь найти вероятностное распределение суммы случайного числа переменных, которые не распределены одинаково. Вот пример:

Джон работает в колл-центре обслуживания клиентов. Он получает звонки с проблемами и пытается их решить. Те, кого он не может решить, он передает их своему начальнику. Предположим, что количество вызовов, которые он получает за день, соответствует распределению Пуассона со средним значением . Сложность каждой проблемы варьируется от довольно простых вещей (с которыми он может определенно иметь дело) до очень специализированных вопросов, которые он не знает, как решить. Предположим , что вероятность р я , что он будет в состоянии решить я -ю проблему следует бета - распределение с параметрами альфа и β и не зависит от предыдущих проблем. Какое распределение звонков он решает за день?μpiαβ

Более формально я имею:

для я = 0 , 1 , 2 , . , , , NY=I(N>0)i=0NXii=0,1,2,...,N

где , ( Х я | р я ) ~ Б е р п о у л л я ( р я ) и р я ~ Б е т ( α , β )NPoisson(μ)(Xi|pi)Bernoulli(pi)piBeta(α,β)

Обратите внимание, что сейчас я рад предположить, что независимы. Я также согласился бы с тем, что параметры μ , α и β не влияют друг на друга, хотя в реальном примере этого, когда μ велико, параметры α и β таковы, что бета-распределение имеет большую массу при низком успехе. ставки с . Но давайте пока проигнорируем это.Xiμ,αβμαβp

Я могу рассчитать но это все. Я также могу смоделировать значения, чтобы получить представление о том, как выглядит распределение Y (оно выглядит как Пуассон, но я не знаю, доходит ли это до чисел μ , α и β, которые я пробовал, или обобщает, и как оно может измениться для разных значений параметров). Любая идея о том, что это за распределение или как я мог бы получить его?P(Y=0)Yμ,αβ

Обратите внимание, что я также разместил этот вопрос на форуме TalkStats, но я подумал, что он может привлечь больше внимания здесь. Извиняюсь за перекрестную рассылку и большое спасибо заранее за ваше время.

EDIT : Как выясняется (см очень полезные ответы ниже - и спасибо за те!), Это действительно распределение, о чем я догадывался, основываясь на своей интуиции и некоторых моделях, но не смог доказать. Что я теперь найти неожиданные однако, заключаетсятомчто распределение Пуассона зависит только от среднего значенияBетвраспределениино не зависит от ее дисперсии.Poisson(μαα+β)Beta

Например, следующие два бета-распределения имеют одинаковое среднее значение, но разную дисперсию. Для ясности синий pdf представляет собой а красный - B e t a ( 0,75 , 0,75 ) .Beta(2,2)Beta(0.75,0.75)

Бета Распределения

Тем не менее, они оба результата в том же распределения , которое, мне кажется слегка нелогичным. (Не сказать, что результат неправильный, просто удивительно!)Poisson(0.5μ)


Для фиксированного есть распределение Пуассона-бинома, но ваша проблема сложнее, чем эта. N
Тим

Спасибо, я знаю о распределении Пуассона-бинома, но здесь случайное. N
Константинос

Вы могли бы взглянуть на составное Пуассона , но вам, возможно, придется поработать с нулями, чтобы сделать это полезным
Glen_b -Reinstate Monica

Ответы:


6

XiNXi=1Xi=01Xi=1p1pμ, На самом деле это так, нам просто необходим дополнительный шаг, чтобы добраться туда.

pi

Pr(Xi|α,β)=01piXi(1pi)1Xipiα1(1pi)β1B(α,β)dpi=B(Xi+α,1Xi+β)B(α,β)

B(a,b)=Γ(a)Γ(b)Γ(a+b)Γ(x+1)=xΓ(x)

Pr(Xi=1|α,β)=Γ(1+α)Γ(β)Γ(1+α+β)Γ(α+β)Γ(α)Γ(β)=αα+β
XiBernoulli(αα+β)Yαμα+β

Числовой пример (с R) ... на рисунке вертикальные линии взяты из симуляции, а красные точки - это pmf, полученный выше:

draw <- function(alpha, beta, mu) 
{ N <- rpois(1, mu); p = rbeta(N, alpha, beta); sum(rbinom(N, size=1, prob=p)) }

pmf <- function(y, alpha, beta, mu)
  dpois(y, alpha*mu/(alpha+beta))

y <- replicate(30000,draw(4,5,10))
tb <- table(y)

# simulated pmf
plot(tb/sum(tb), type="h", xlab="Y", ylab="Probability")
# analytic pmf
points(0:max(y), pmf(0:max(y), 4, 5, 10), col="red")

введите описание изображения здесь


3
  1. piBeta(α,β)E[pi]=αα+βi

  2. μαα+βμαα+β

  3. P(Y=0)=eμα/(α+β)

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.