Общая сумма гамма-случайных величин

35

Я читал, что сумма гамма-случайных величин с тем же параметром масштаба является еще одной гамма-случайной величиной. Я также видел статью Moschopoulos, описывающую метод суммирования общего набора гамма-случайных величин. Я пытался реализовать метод Мосхопулоса, но пока не добился успеха.

Как выглядит суммирование общего набора гамма-случайных величин? Чтобы конкретизировать этот вопрос, как он выглядит:

$\text{Gamma}(3,1) + \text{Gamma}(4,2) + \text{Gamma}(5,1)$

Если приведенные выше параметры не особенно показательны, пожалуйста, предложите другие.

— OSE
источник

4

Явное решение для суммы любых двух гамма-распределений было размещено на stats.stackexchange.com/a/252192 .

— whuber

Особый пример этого, где все гамма-распределения имеют параметр формы 1 (то есть они экспоненциальные), называется гипоэкспоненциальным распределением (семейством) . Для случая только двух экспоненциальных распределений также есть явная формула, приведенная на stats.stackexchange.com/questions/412849 .

— uber

37

Сначала объедините любые суммы, имеющие один и тот же масштабный коэффициент : переменная $\Gamma(n, \beta)$ плюс a $\Gamma(m,\beta)$ образуют переменную $\Gamma(n+m,\beta)$ .

Далее заметим, что характеристическая функция (cf) для $\Gamma(n, \beta)$ равна $(1-i \beta t)^{-n}$ , откуда cf суммы этих распределений является произведением

\underset{J}{Π} \frac{1}{(1 - я β_{J} T)^{N_{J}}},

$\prod_{j} \frac{1}{(1-i \beta_j t)^{n_j}}.$

Когда весь интеграл, этот продукт расширяется в виде частичной доли в линейную комбинацию из , где целых числа от и . В примере с (из суммы и $n_j$ $(1-i \beta_j t)^{-\nu}$ $\nu$ $1$ $n_j$ $\beta_1 = 1, n_1=8$ $\Gamma(3,1)$ ) и находим $\Gamma(5,1)$ $\beta_2 = 2, n_2=4$

\frac{1}{(1 - i t)^{8}} \frac{1}{(1 - 2 i t)^{4}} = \frac{1}{(x + i)^{8}} - \frac{8 i}{(x + i)^{7}} - \frac{40}{(x + i)^{6}} + \frac{160 i}{(x + i)^{5}} + \frac{560}{(x + i)^{4}} - \frac{1792 i}{(x + i)^{3}} - \frac{5376}{(x + i)^{2}} + \frac{15360 i}{x + i} + \frac{256}{(2 x + i)^{4}} + \frac{2048 i}{(2 x + i)^{3}} - \frac{9216}{(2 x + i)^{2}} - \frac{30720 i}{2 x + i} .

$\frac{1}{(1-i t)^{8}}\frac{1}{(1- 2i t)^{4}} = \\ \frac{1}{(x+i)^8}-\frac{8 i}{(x+i)^7}-\frac{40}{(x+i)^6}+\frac{160 i}{(x+i)^5}+\frac{560}{(x+i)^4}-\frac{1792 i}{(x+i)^3}\\-\frac{5376}{(x+i)^2}+\frac{15360 i}{x+i}+\frac{256}{(2 x+i)^4}+\frac{2048 i}{(2 x+i)^3}-\frac{9216}{(2 x+i)^2}-\frac{30720 i}{2 x+i}.$

Обратное взятие cf является обратным преобразованием Фурье, которое является линейным : это означает, что мы можем применять его термин за термином. Каждый член распознается как кратное cf гамма-распределения и поэтому легко инвертируется для получения PDF . В примере мы получаем

\frac{е^{- T} T^{7}}{5040} + \frac{1}{90} е^{- T} T^{6} + \frac{1}{3} е^{- T} T^{5} + \frac{20}{3} е^{- T} T^{4} + \frac{8}{3} е^{- \frac{T}{2}} T^{3} + \frac{280}{3} е^{- T} T^{3} - 128 е^{- \frac{T}{2}} T^{2} + +896 е^{- T} T^{2} + 2304 е^{- \frac{T}{2}} T + 5376 е^{- T} T - 15360 е^{- \frac{T}{2}} + 15360 е^{- T}

$\frac{e^{-t} t^7}{5040}+\frac{1}{90} e^{-t} t^6+\frac{1}{3} e^{-t} t^5+\frac{20}{3} e^{-t} t^4+\frac{8}{3} e^{-\frac{t}{2}} t^3+\frac{280}{3} e^{-t} t^3\\ -128 e^{-\frac{t}{2}} t^2+896 e^{-t} t^2+2304 e^{-\frac{t}{2}} t+5376 e^{-t} t-15360 e^{-\frac{t}{2}}+15360 e^{-t}$

для PDF суммы.

Это конечная смесь гамма-распределений с масштабными коэффициентами, равными коэффициентам в сумме, и коэффициентами формы, меньшими или равными коэффициентам в сумме. За исключением особых случаев (где может произойти некоторое аннулирование), число слагаемых задается параметром общей формы (при условии, что все различны). $n_1 + n_2 + \cdots$ $n_j$

В качестве теста приведем гистограмму из результатов, полученных путем добавления независимых отрисовок из распределений и . На него накладывается график, в раза превышающий предыдущую функцию. Подгонка очень хорошая. $10^4$ $\Gamma(8,1)$ $\Gamma(4,2)$ $10^4$

фигура

Мошопулос продвигает эту идею на один шаг вперед, расширяя cf суммы в бесконечный ряд гамма-характеристических функций всякий раз, когда один или несколько из нецелочислен, а затем завершает бесконечный ряд в точке, где он достаточно хорошо аппроксимируется. , $n_i$

— Whuber
источник

2

Незначительное комментарий: Как правило, конечное смесь означает PDF вида

где

и

, то есть в

являются вероятностями, и PDF может быть интерпретирован как (закон полной вероятности) взвешенной суммы условных PDF, учитывая различные условия, которые возникают с вероятностями

f (x) = \sum_{i = 1}^{n} a_{i} f_{i} (x)

$f(x) = \sum_{i=1}^n a_i f_i(x)$

a_{i} > 0

$a_i > 0$

\sum_{i} a_{i} = 1

$\sum_i a_i = 1$

a_{i}

$a_i$

a_{i}

$a_i$ , Однако в приведенной выше сумме некоторые коэффициенты являются отрицательными, и поэтому стандартная интерпретация смеси не применяется.

— Дилип Сарватэ

@Dilip Это хороший момент. Что делает этот случай интересным, так это то, что хотя некоторые коэффициенты могут быть отрицательными, тем не менее эта комбинация все еще является действительным распределением (по самой своей конструкции).

— whuber

Можно ли расширить этот подход для учета добавления зависимых переменных? В частности, я хочу добавить 6 дистрибутивов, каждый из которых имеет некоторую корреляцию с другими.

— masher

11

Я покажу другое возможное решение, которое довольно широко применимо, и с сегодняшним программным обеспечением R, довольно простое в реализации. Это приближение плотности седловой точки, которое должно быть более широко известным!

Для терминологии о гамма-распределении я буду следовать https://en.wikipedia.org/wiki/Gamma_distribution с параметризацией формы / масштаба, - параметр формы, а - масштаб. Для приближения седловой точки я буду следовать Рональду В. Батлеру: «Приближения седловой точки с приложениями» (Кембридж UP). Приближение седловой точки объясняется здесь: Как работает приближение седловой точки? здесь я покажу, как это используется в этом приложении. $k$ $\theta$

Пусть - случайная величина с существующей порождающей момент функцией которая должна существовать для в некотором открытом интервале, который содержит ноль. Затем определим производящую функцию кумулянта как Известно, что $X$

M (s) знак равно Е е^{s Икс}

$M(s) = E e^{sX}$

s

$s$

К (s) знак равно журнал M (s)

$K(s) = \log M(s)$

E X = K^{'} (0), Var (X) = K^{″} (0)

$E X = K'(0), \text{Var} (X) = K''(0)$ , Уравнение является перевал

, который определяет неявный

как функции

(которое должно быть в диапазоне

). Обозначим эту функцию неявно определенную как

. Обратите внимание, что уравнение седловой точки всегда имеет ровно одно решение, потому что кумулянтная функция является выпуклой.

K^{'} (\hat{s}) = x

$K'(\hat{s}) = x$

s

$s$

x

$x$

X

$X$

\hat{s} (x)

$\hat{s}(x)$

Тогда перевала приближение к плотности из задается $f$ $X$

\hat{f} (x) = \frac{1}{\sqrt{2 π K^{″} (\hat{s})}} \exp (K (\hat{s}) - \hat{s} x)

$\hat{f}(x) = \frac1{\sqrt{2\pi K''(\hat{s})}} \exp(K(\hat{s}) - \hat{s} x)$

$X_1, X_2, \dots, X_n$ $X_i$ $(k_i, \theta_i)$

K (s) = - \sum_{i = 1}^{n} k_{i} \ln (1 - θ_{i} s)

$K(s) = -\sum_{i=1}^n k_i \ln(1-\theta_i s)$

s < 1 / max (θ_{1}, θ_{2}, \dots, θ_{n})

$s<1/\max(\theta_1, \theta_2, \dots, \theta_n)$

K^{'} (s) = \sum_{i = 1}^{n} \frac{k_{i} θ_{i}}{1 - θ_{i} s}

$K'(s) = \sum_{i=1}^n \frac{k_i \theta_i}{1-\theta_i s}$

K^{″} (s) = \sum_{i = 1}^{n} \frac{k_{i} θ_{i}^{2}}{(1 - θ_{i} s)^{2}} .

$K''(s) = \sum_{i=1}^n \frac{k_i \theta_i^2}{(1-\theta_i s)^2}.$ R

n = 3

$n=3$

k = (1, 2, 3)

$k=(1,2,3)$

θ = (1, 2, 3)

$\theta=(1,2,3)$ R

shape <- 1:3 #ki
scale <- 1:3 # thetai
# For this case,  we get expectation=14,  variance=36
make_cumgenfun  <-  function(shape, scale) {
      # we return list(shape, scale, K, K', K'')
      n  <-  length(shape)
      m <-   length(scale)
      stopifnot( n == m, shape > 0, scale > 0 )
      return( list( shape=shape,  scale=scale, 
                    Vectorize(function(s) {-sum(shape * log(1-scale * s) ) }),
                    Vectorize(function(s) {sum((shape*scale)/(1-s*scale))}) ,
                    Vectorize(function(s) { sum(shape*scale*scale/(1-s*scale)) }))    )
}

solve_speq  <-  function(x, cumgenfun) {
          # Returns saddle point!
          shape <- cumgenfun[[1]]
          scale <- cumgenfun[[2]]
          Kd  <-   cumgenfun[[4]]
          uniroot(function(s) Kd(s)-x,lower=-100,
                  upper = 0.3333, 
                  extendInt = "upX")$root
}

make_fhat <-  function(shape,  scale) {
    cgf1  <-  make_cumgenfun(shape, scale)
    K  <-  cgf1[[3]]
    Kd <-  cgf1[[4]]
    Kdd <- cgf1[[5]]
    # Function finding fhat for one specific x:
    fhat0  <- function(x) {
        # Solve saddlepoint equation:
        s  <-  solve_speq(x, cgf1)
        # Calculating saddlepoint density value:
        (1/sqrt(2*pi*Kdd(s)))*exp(K(s)-s*x)
    }
    # Returning a vectorized version:
    return(Vectorize(fhat0))
} #end make_fhat

 fhat  <-  make_fhat(shape, scale)
plot(fhat, from=0.01,  to=40, col="red", main="unnormalized saddlepoint approximation\nto sum of three gamma variables")

в результате на следующем участке: введите описание изображения здесь

Я оставлю нормализованное приближение седловой точки в качестве упражнения.

— Къетил б Халворсен
источник

1

Это интересно, но я не могу заставить ваш Rкод работать, чтобы сравнить приближение с точным ответом. Любая попытка вызвать fhatприводит к ошибкам, по-видимому, при использовании uniroot.

— whuber

3

Какая у тебя версия R? В кодах для uniroot используется новый аргумент extensionInt, который был представлен в версии 3.1 R. Если ваш R старше, вы можете попытаться удалить его (и увеличить интервал, заданный uniroot). Но это сделает код менее надежным!

— kjetil b halvorsen

10

Уравнение Уэлча – Саттервейта может быть использовано для получения приблизительного ответа в форме гамма-распределения. Это имеет приятное свойство, позволяющее нам рассматривать гамма-распределения как (приблизительно) закрытые при добавлении. Это приближение в обычно используемом t-тесте Уэлча.

(Гамма-распределение можно рассматривать как масштабированное распределение хи-квадрат и допускает нецелочисленный параметр формы.)

$k, \theta$

К_{s U м} знак равно \frac{(\underset{я}{Σ} θ_{я} К_{я})^{2}}{\underset{я}{Σ} θ_{я}^{2} К_{я}}

$k_{sum} = { (\sum_i \theta_i k_i)^2 \over \sum_i \theta_i^2 k_i }$

θ_{s U м} знак равно \frac{Σ θ_{я} К_{я}}{К_{s U м}}

$\theta_{sum} = { { \sum \theta_i k_i } \over k_{sum} }$

$k=(3,4,5)$ $\theta=(1,2,1)$

Таким образом, мы получаем примерно гамма (10,666 ..., 1,5)

$k$ $\theta_i$ $\theta$

— Пол Харрисон
источник

6

$n$

г D С (a, б, α, β; τ) знак равно {\begin{array}{cc} \frac{б^{a} β^{α}}{Γ (a + α)} е^{- б τ} {τ^{a + α}}^{- 1}_{1} F_{1} [α, a + α, (б - β) τ], & τ > 0 \\ 0, τ \leq 0 \end{array},

$\mathrm{G}\mathrm{D}\mathrm{C}\left(\mathrm{a}\kern0.1em ,\mathrm{b}\kern0.1em ,\alpha, \beta; \tau \right)=\left\{\begin{array}{cc}\hfill \frac{{\mathrm{b}}^{\mathrm{a}}{\beta}^{\alpha }}{\Gamma \left(\mathrm{a}+\alpha \right)}{e}^{-\mathrm{b}\tau }{\tau^{\mathrm{a}+\alpha}}^{-1}{}_1F_1\left[\alpha, \mathrm{a}+\alpha, \left(\mathrm{b}-\beta \right)\tau \right],\hfill & \hfill \tau >0\hfill \\ {}\hfill \kern2em 0\kern6.6em ,\hfill \kern5.4em \tau \kern0.30em \le \kern0.30em 0\hfill \end{array}\right.,$

G a m m a (a, b) \to Γ (a, 1 / b)

$Gamma(a,b) \rightarrow \Gamma(a,1/b)$

b

$b$

β

$\beta$

— деревенщина
источник