Весовая сумма двух независимых пуассоновских случайных величин


10

Используя википедию, я нашел способ вычислить функцию вероятности массы, полученную из суммы двух пуассоновских случайных величин. Тем не менее, я думаю, что у меня неправильный подход.

Пусть - две независимые пуассоновские случайные величины со средним значением и , где и - константы, тогда функция генерирующая вероятность, задается Теперь, используя тот факт, что функция, генерирующая вероятность для пуассоновской случайной величины, имеет вид , мы можем написать функцию, генерирующую вероятность: сумма двух независимых пуассоновских случайных величин как X1,X2λ1,λ2S2=a1X1+a2X2a1a2S2

GS2(z)=E(zS2)=E(za1X1+a2X2)GX1(za1)GX2(za2).
GXi(z)=eλi(z1)
GS2(z)=eλ1(za11)eλ2(za21)=eλ1(za11)+λ2(za21).
Похоже, что функция вероятности массы восстанавливается путем взятия производных от , Где .S2GS2(z) Pr(S2=k)=GS2(k)(0)k!GS2(k)=dkGS2(z)dzk

Это правильно? У меня такое ощущение, что я не могу просто взять производную для получения функции вероятности массы из-за констант a1 и a2 . Это правильно? Есть ли альтернативный подход?

Если это правильно, могу ли я теперь получить приближение кумулятивного распределения путем усечения бесконечной суммы по всем k?


1
Почему вы масштабируете слагаемые с и ? Сумма - это просто еще одно распределение Пуассона без этого. Переменные принимают значения в натуральных числах, так что примерно в раз первое плюс умноженное на второе обычно неестественно и позволит вам восстановить значения обеих переменных. 2a1a212
Дуглас Заре

3
Сложность в том, что если и являются целыми числами, нельзя быть уверенным, что принимает только целые значения. Таким образом, вам нужно найти не только для целых значений но также для каждой которая может быть выражена как для неотрицательных целых чисел и . a 2 S 2 P ( S 2 = k ) k P ( S 2 = α ) α a 1 m + a 2 n m na1a2S2P(S2=k)kP(S2=α)αa1m+a2nmn
Дилип Сарвате

@DilipSarwate Это возможно? Есть ли другой подход для этого?
Мишель

@ DouglasZare Я должен сделать это ... Может быть, я должен обратиться к какому-то методу начальной загрузки.
Мишель

1
Я не думаю, что вы можете сделать намного лучше, чем метод грубой силы, который находит возможные значения, которые может принимать, а затем для каждой , используйтеДля большинства вариантов и я бы ожидал, что большинство сумм сократится до одного члена. Я ожидаю , что вы знаете , что для , является случайной величиной Пуассона с параметром . α P { S 2 = α } = a 1 m + a 2 n = α P { X 1 = m } P { X 2 = n } = a 1 m + a 2 n = α exp ( - λ 1 м ) λ м 1S2αa1a2a1=a2=1S2λ1+λ2
п{S2знак равноα}знак равноΣa1м+a2Nзнак равноαп{Икс1знак равном}п{Икс2знак равноN}знак равноΣa1м+a2Nзнак равноαехр(-λ1м)λ1мм!ехр(-λ2N)λ2NN!,
a1a2a1знак равноa2знак равно1S2λ1+λ2
Дилип Сарвате

Ответы:


5

При условии, что не всякая вероятность сконцентрирована на каком-либо одном значении в этой линейной комбинации, похоже, что расширение Корниша-Фишера может обеспечить хорошие приближения к (обратному) CDF.

Напомним, что это расширение корректирует обратный CDF стандартного нормального распределения, используя первые несколько кумулянтов . Его перекос являетсяβ 1S2β1

a13λ1+a23λ2(a12λ1+a22λ2)3

и его эксцесс являетсяβ2

a14λ1+3a14λ12+a24λ2+6a12a22λ1λ2+3a24λ22(a12λ1+a22λ2)2,

Чтобы найти процентиль стандартизированной версии , вычислитеαS2

весαзнак равноZ+16β1(Z2-1)+124(β2-3)(Z2-3)Z-136β12Z(2Z2-5Z)-124(β2-3)β1(Z4-5Z2+2)

где - процентиль стандартного нормального распределения. Тем самым процентильα S 2ZαS2

a1λ1+a2λ2+весαa12λ1+a22λ2,

Численные эксперименты показывают, что это хорошее приближение, когда значения и превышают или около того. Например, рассмотрим случай и (скомпонован так, чтобы дать нулевое среднее значение для удобства):λ 2 5 λ 1 = 5 , λ 2 = 5 π / 2 , a 1 = π , a 2 = -λ1λ25λ1знак равно5, λ2знак равно5π/2, a1знак равноπ,a2знак равно-2

фигура

Заштрихованная синим цветом часть представляет собой численно вычисленный CDF для а сплошной красный внизу - приближение Корниш-Фишера. Аппроксимация, по сути, является сглаживанием фактического распределения, показывая только небольшие систематические отклонения.S2


2
Хорошее использование часто забываемого инструмента ... и, конечно, для или или около того, метод грубой силы свертки не будет таким уж болезненным. λ 25λ1λ25
jbowman

1

Используйте свертку:

Пусть Для , противном случае и Для , противном случае.x10fX1(x1)=0fX2(x2)=λ x 2 eеИкс1(Икс1)знак равноλИкс1е-λИкс1!Икс10еИкс1(Икс1)знак равно0х20фх2(х2еИкс2(Икс2)знак равноλИкс2е-λИкс2!Икс20еИкс2(Икс2)знак равно0

Пусть , поэтому Первый из них известен как свертка.f Z ( z ) = - - f x 1 , x 2 ( z - x 2 , x 2 ) d x 1 dZзнак равноИкс1+Икс2Икс1знак равноZ-Икс2

еZ(Z)знак равно--еИкс1,Икс2(Z-Икс2,Икс2)dИкс1dИкс2

Если и независимы, Таким образом, вы можете получить распределение суммы двух непрерывных случайных величин.X 2 f Z ( z ) = - - f X 1 ( z - x 2 ) f X 2 ( x 2 ) d x 1 dИкс1Икс2

еZ(Z)знак равно--еИкс1(Z-Икс2)еИкс2(Икс2)dИкс1dИкс2

Для дискретного распределения Это также распределение Пуассона с параметром=е-(λ1+λ2)(λ1+λ

еZ(Z)знак равноΣИкс2знак равно0Zλ1Z-Икс2е-λ1(Z-Икс2)!λ2Икс2е-λ2Икс2!
λ1+λ2
знак равное-(λ1+λ2)(λ1+λ2)ZZ!
λ1+λ2

2
Похоже, это отвечает на другой вопрос: а именно, как добавить два распределения Пуассона. Это особый случай (но может быть распространен на случаи без каких-либо проблем). Но что бы вы сделали, когда ? a 1 = a 2 a 1a 2a1знак равноa2знак равно1a1знак равноa2a1a2
whuber

0

Я думаю, что решением является концепция составного распределения Пуассона. Идея является случайной суммой с Пуассона распределены и и последовательность не зависит от . Когда мы ОГРАНИЧЕНИЯ к случаю, всегда, то мы можем описать для вещественного числа и распределению Пуассона . Вы получаете pgf как Для суммы вы получите определять

Sзнак равноΣязнак равно1NИкся
NИксяяяdNИксязнак равноККNКN
Е[sКN]знак равноЕ[(sК)N]знак равногN(sК)знак равноехр(λ(sК-1))
Zзнак равноК1N1+К2N2
гZ(s)знак равноехр(λ1(sК1-1)+λ2(sК2-1)),
λзнак равноλ1+λ2 затем Окончательная интерпретация заключается в том, что результирующее rv является составным распределением Пуассона с интенсивностью и распределением которые принимают значение с вероятностью и значение с .
гZ(s)знак равноехр(λ(λ1λ(sК1-1)+λ2λ(sК1-1))знак равноехр(λ(λ1λsК1+λ2λsК1-1)),
λзнак равноλ1+λ2ИксяК1λ1/λК2λ2/λ

Доказав, что распределения составные Пуассона, мы можем использовать рекурсию Панджера в случае, когда и являются положительными целыми числами. Или мы можем легко вывести преобразование Фурье из формы pgf и вернуть распределение обратно. Обратите внимание, что есть точка массы в .К1К20

Изменить после обсуждения:

Я думаю, что лучшее, что вы можете сделать, это MC. Вы можете использовать вывод, что это составной пуассоновский дистр.

  1. образец N из (очень эффективный)пояs(λ)
  2. затем для каждого выборки, будь то из или где вероятность первого равна . Сделайте это путем отбора проб Бернулли с вероятностью успеха . Если это тогда добавьте к выбранной сумме, иначе добавьте .язнак равно1,...,NИкс1Икс2λ1/λλ1/λ1К1К2

У вас будет образец, скажем, 100 000 в секундах.

В качестве альтернативы вы можете выбрать два слагаемых в вашем начальном представлении отдельно ... это будет так же быстро.

Все остальное (БПФ) сложно, если постоянные множители k1 и k2 являются полностью общими.


1
И окончательное распределение может быть найдено с помощью алгоритма Панджера, если факторы являются целыми числами.
Рик

Спасибо! Я попал в Однако Исходя из этого, я хотел бы найти способ получить какое-то распространение. Вы упомянули алгоритм Панджера? Однако в этом случае . @DilipSarwate Только что упомянул, что невозможно упростить следующее в общем случае . гS2(Z)знак равноеλ1(Za1-1)еλ2(Za2-1)a1,a2р1п{S2знак равноα}знак равноΣa1м+a2Nзнак равноαп{Икс1знак равном}п{Икс2знак равноN}знак равноΣa1м+a2Nзнак равноαехр(-λ1м)λ1мм!ехр(-λ2N)λ2NN!,a1,a2
Мишель

Привет Мишель, я отредактировал свой ответ. Да, Panjer имеет ограниченное использование. Но вы можете попробовать метод преобразования Фурье. Однако нецелые единицы являются проблематичными ... Я должен больше думать о том, что делать в этом случае. В любом случае важно отметить, что результатом является составное распределение Пуассона (а не «простое» распределение Пуассона).
Рик

Привет Ричард, спасибо за ваше обновление! Вы имеете в виду, что я должен численно попытаться вычислить: ? пр(S2знак равноИкс)знак равно12πре-яTИксгS2(еяT)dT
Мишель

Что-то на пути ... Если у нас было непрерывное распределение, из которого мы можем вычислить характеристическую функцию (как вы делаете), то это приводит к быстрому и приятному результату. В нашем случае мне нужно больше времени, чтобы подумать об этом. Там должно быть что-то проще.
Рик
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.