Обобщение вопроса требует распределения Y=⌊X/m⌋ когда распределение X известно и поддерживается на натуральных числах. (В вопросе X имеет пуассоновское распределение параметра λ=λ1+λ2+⋯+λn и m=n .)
Распределение Y легко определяется распределением mY , вероятность которого производящая функция (PGF) может быть определена в терминах PGF из X . Вот схема деривации.
Напишите для pgf из , где (по определению) . построен из таким образом, что его pgf, ,X p n = Pr ( X = n ) m Y X qp(x)=p0+p1x+⋯+pnxn+⋯Xpn=Pr(X=n)mYXq
q(x)=(p0+p1+⋯+pm−1)+(pm+pm+1+⋯+p2m−1)xm+⋯+(pnm+pnm+1+⋯+p(n+1)m−1)xnm+⋯.
Потому что это сходится абсолютно для , мы можем переставить слагаемые в сумму частей вида| х | ≤ 1
Dм , тр ( х ) = рT+ рт + мИксм+ ⋯ + pт + н мИксп м+ ⋯
для . В степенной ряд функции состоят из любого срок серии , начиная с : это иногда называют прореживания из . Поиски в Google в настоящее время не дают много полезной информации о децимациях, поэтому для полноты приведем формулу.x t D m , t p m th p t th pt = 0 , 1 , … , м - 1ИксTDм , тпмгопTгоп
Пусть будет любым примитивным корнем единства; например, взять . Тогда из и чтоm th ω = exp ( 2 i π / m ) ω m = 1 ∑ m - 1 j = 0 ω j = 0ωмгоω = exp( 2 я π/ м)ωм= 1Σм - 1J = 0ωJ= 0
ИксTDм , тр ( х ) = 1мΣJ = 0м - 1ωт Jp ( x / ωJ) .
Чтобы увидеть это, обратите внимание, что оператор является линейным, поэтому достаточно проверить формулу на основе . Применение правой части к дает { 1 , x , x 2 , … , x n , … } x nИксTDм , т{ 1 , х , х2, … , ХN, ... }ИксN
ИксTDм , т[ хN] = 1мΣJ = 0m−1ωtjxnω−nj=xnm∑j=0m−1ω(t−n)j.
Когда и отличаются кратным , каждый член в сумме равен и мы получаем . В противном случае члены циклически перебирают степени и они суммируются до нуля. Откуда этот оператор сохраняет все степени совпадающие с по модулю и убивает все остальные: это именно требуемая проекция.н м 1 х н ω т - н х т мtnm1xnωt−nxtm
Формула для легко следует, изменив порядок суммирования и признав одну из сумм геометрической, записав ее в замкнутой форме:q
q(x)=∑t=0m−1(Dm,t[p])(x)=∑t=0m−1x−t1m∑j=0m−1ωtjp(ω−jx)=1m∑j=0m−1p(ω−jx)∑t=0m−1(ωj/x)t=x(1−x−m)m∑j=0m−1p(ω−jx)x−ωj.
Например, pgf распределения Пуассона параметра имеет вид . С , и PGF из будетp ( x ) = exp ( λ ( x - 1 ) ) m = 2 ω = - 1 2 Yλp(x)=exp(λ(x−1))m=2ω=−12Y
q(x)=x(1−x−2)2∑j=02−1p((−1)−jx)x−(−1)j=x−1/x2(exp(λ(x−1))x−1+exp(λ(−x−1))x+1)=exp(−λ)(sinh(λx)x+cosh(λx)).
Одним из применений этого подхода является вычисление моментов и . Значение производной от pgf, оцененного при является факториальным моментом. момент является линейной комбинацией первых факторных моментов. Используя эти наблюдения, мы находим, например, что для пуассоновского распределенного его среднее значение (которое является первым факториальным моментом) равно , среднее равно , а среднее значение равноm Y k th x = 1 k th k th k X λ 2 ⌊ ( X / 2 ) ⌋ λ - 1XmYkthx=1kthkthkXλ2⌊(X/2)⌋3⌊(X/3)⌋λ-1+e-3λ/2(sin ( √λ−12+12e−2λ3⌊(X/3)⌋λ−1+e−3λ/2(sin(3√λ2)3√+cos(3√λ2)) :
Средние значения для показаны синим, красным и желтым соответственно как функции от : асимптотически среднее значение падает на по сравнению с исходным средним Пуассона.λ ( m - 1 ) / 2m=1,2,3λ(m−1)/2
Аналогичные формулы для дисперсий могут быть получены. (Они становятся беспорядочными по мере подъема и поэтому опускаются. Одна вещь, которую они окончательно устанавливают, это то, что когда кратное не кратно Пуассону: оно не имеет характерного равенства среднего значения и дисперсии) Вот график дисперсий как функция для :m > 1 Y λ m = 1 , 2 , 3mm>1Yλm=1,2,3
Интересно, что при больших значениях дисперсии увеличиваются . Интуитивно это объясняется двумя конкурирующими явлениями: функция пола эффективно объединяет группы значений, которые изначально были различны; это должно привести к уменьшению дисперсии . В то же время, как мы уже видели, средства тоже меняются (потому что каждая ячейка представлена наименьшим значением); это должно привести к тому, что термин, равный квадрату разности средств, будет добавлен обратно. Увеличение дисперсии для больших становится больше с большими значениями .λ mλλm
Поведение дисперсии с на удивление сложное. Давайте закончим быстрой симуляцией (в ), показывающей, на что она способна. Графики показывают разницу между дисперсией и дисперсией для пуассоновского распределенного с различными значениями диапазоне от до . Во всех случаях графики, похоже, достигли своих асимптотических значений справа.m m ⌊ X / m ⌋ X X λ 1 5000mYmR
m⌊X/m⌋XXλ15000
set.seed(17)
par(mfrow=c(3,4))
temp <- sapply(c(1,2,5,10,20,50,100,200,500,1000,2000,5000), function(lambda) {
x <- rpois(20000, lambda)
v <- sapply(1:floor(lambda + 4*sqrt(lambda)),
function(m) var(floor(x/m)*m) - var(x))
plot(v, type="l", xlab="", ylab="Increased variance",
main=toString(lambda), cex.main=.85, col="Blue", lwd=2)
})