Связь между гамма-распределением и нормальным распределением

Недавно я счел необходимым получить pdf для квадрата нормальной случайной величины со средним значением 0. По какой-то причине я предпочел не нормализовать дисперсию заранее. Если я сделал это правильно, то этот PDF-файл выглядит следующим образом:

N^{2} (x; σ^{2}) = \frac{1}{σ \sqrt{2 π} \sqrt{x}} e^{\frac{- x}{2 σ^{2}}}

$N^2(x; \sigma^2) = \frac{1}{\sigma \sqrt{2 \pi} \sqrt{x}} e^{\frac{-x}{2\sigma^2}}$

Я заметил, что на самом деле это просто параметризация гамма-распределения:

N^{2} (x; σ^{2}) = Gamma (x; \frac{1}{2}, 2 σ^{2})

$N^2(x; \sigma^2) = \operatorname{Gamma}(x; \frac{1}{2}, 2 \sigma^2)$

А затем из того факта, что сумма двух гамм (с одним и тем же параметром масштаба) равна другой гамме, следует, что гамма эквивалентна сумме $k$ квадратов нормальных случайных величин.

N_{Σ}^{2} (x; k, σ^{2}) = Gamma (x; \frac{k}{2}, 2 σ^{2})

$N^2_\Sigma(x; k, \sigma^2) = \operatorname{Gamma}(x; \frac{k}{2}, 2 \sigma^2)$

Это было немного удивительно для меня. Несмотря на то, что я знал, что распределение $\chi^2$ - распределение суммы квадратов стандартных нормальных RV - было частным случаем гаммы, я не знал, что гамма по сути является просто обобщением, учитывающим сумму нормальных случайных величин из любой дисперсии. Это также приводит к другим характеристикам, с которыми я раньше не сталкивался, таким как экспоненциальное распределение, эквивалентное сумме двух квадратов нормальных распределений.

Это все несколько загадочно для меня. Является ли нормальное распределение фундаментальным для получения гамма-распределения, как я описал выше? В большинстве ресурсов, которые я проверял, не упоминается, что эти два распределения неразрывно связаны, как это, или даже в этом отношении описывается, как получается гамма. Это заставляет меня думать, что действует какая-то истина более низкого уровня, которую я просто запутанно выделил?

normal-distribution gamma-distribution

— timxyz
источник

Многие учебники для студентов по теории вероятностей упоминают все вышеупомянутые результаты; но, возможно, статистические тексты не охватывают эти идеи? В любом случае,

N (0, σ^{2})

$N(0,\sigma^2)$ случайная величина

Y_{i}

$Y_i$ просто

σ X_{i}

$\sigma X_i$ , где

X_{i}

$X_i$ является стандартной нормальной случайной величиной, и так (для н.о.р. переменных)

\sum_{i} Y_{i}^{2} = σ^{2} \sum_{i} X_{i}^{2}

$\sum_i Y_i^2 = \sigma^2 \sum_i X_i^2$ просто масштабированный

χ^{2}

$\chi^2$ Случайная величина не удивительна для тех, кто изучал теорию вероятностей.

— Дилип Сарвэйт

Я из области компьютерного зрения, поэтому обычно не сталкиваюсь с теорией вероятности. Ни один из моих учебников (или Википедия) не упоминает эту интерпретацию. Я предполагаю, что я также спрашиваю, что особенного в сумме квадрата двух нормальных распределений, что делает его хорошей моделью для времени ожидания (то есть экспоненциального распределения). Такое ощущение, что мне чего-то не хватает.

— Timxyz

Поскольку Википедия определяет распределение хи-квадрат как сумму квадратов нормалей на en.wikipedia.org/wiki/Chi-squared_distribution#Definition и упоминает, что хи-квадрат является частным случаем гаммы (на en.wikipedia.org/wiki / Gamma_distribution # Others ), вряд ли можно утверждать, что эти отношения недостаточно известны. Само отклонение просто устанавливает единицу измерения (параметр шкалы) во всех случаях и, таким образом, не вносит никаких дополнительных усложнений.

— whuber

В то время как эти результаты хорошо известны в области вероятности и статистики, вам, @timxyz, очень приятно, что вы снова обнаружили их в своем собственном анализе.

— Восстановить Монику

Эта связь не таинственна, потому что они являются членами экспоненциального семейства распределений, существенное свойство которых заключается в том, что они могут быть получены путем замены переменных и / или параметров. Смотрите более длинный ответ ниже с примерами.

— Карл

Ответы:

Как отмечается в комментарии профессора Сарвэйта, отношения между квадратом нормали и хи-квадратом являются очень широко распространенным фактом - так же как и тот факт, что хи-квадрат является лишь частным случаем гамма-распределения:

X \sim N (0, σ^{2}) \Rightarrow X^{2} / σ^{2} \sim χ_{1}^{2} \Rightarrow X^{2} \sim σ^{2} χ_{1}^{2} = Gamma (\frac{1}{2}, 2 σ^{2})

$X \sim N(0,\sigma^2) \Rightarrow X^2/\sigma^2 \sim \mathcal \chi^2_1 \Rightarrow X^2 \sim \sigma^2\mathcal \chi^2_1= \text{Gamma}\left(\frac 12, 2\sigma^2\right)$

последнее равенство, вытекающее из свойства масштабирования гаммы.

Что касается отношения с экспонентой, то, если быть точным, это сумма двух квадратов нормалей с нулевым средним, каждая из которых масштабируется по дисперсии другого , что приводит к экспоненциальному распределению:

X_{1} \sim N (0, σ_{1}^{2}), X_{2} \sim N (0, σ_{2}^{2}) \Rightarrow \frac{X_{1}^{2}}{σ_{1}^{2}} + \frac{X_{2}^{2}}{σ_{2}^{2}} \sim χ_{2}^{2} \Rightarrow \frac{σ_{2}^{2} X_{1}^{2} + σ_{1}^{2} X_{2}^{2}}{σ_{1}^{2} σ_{2}^{2}} \sim χ_{2}^{2}

$X_1 \sim N(0,\sigma^2_1),\;\; X_2 \sim N(0,\sigma^2_2) \Rightarrow \frac{X_1^2}{\sigma^2_1}+\frac{X_2^2}{\sigma^2_2} \sim \mathcal \chi^2_2 \Rightarrow \frac{\sigma^2_2X_1^2+ \sigma^2_1X_2^2}{\sigma^2_1\sigma^2_2} \sim \mathcal \chi^2_2$

\Rightarrow σ_{2}^{2} X_{1}^{2} + σ_{1}^{2} X_{2}^{2} \sim σ_{1}^{2} σ_{2}^{2} χ_{2}^{2} = Gamma (1, 2 σ_{1}^{2} σ_{2}^{2}) = Exp (\frac{1}{2 σ_{1}^{2} σ_{2}^{2}})

$\Rightarrow \sigma^2_2X_1^2+ \sigma^2_1X_2^2 \sim \sigma^2_1\sigma^2_2\mathcal \chi^2_2 = \text{Gamma}\left(1, 2\sigma^2_1\sigma^2_2\right) = \text{Exp}( {1\over {2\sigma^2_1\sigma^2_2}})$

Но подозрение, что есть «нечто особенное» или «более глубокое» в сумме двух квадратов нулевых средних, которое «делает их хорошей моделью для времени ожидания», необоснованно: во-первых, что особенного в экспоненциальном распределении, которое делает это хорошая модель для "времени ожидания"? Без памяти, конечно, но есть ли здесь что-то «более глубокое», или просто простая функциональная форма функции экспоненциального распределения и свойства ? Уникальные свойства разбросаны по всей математике, и в большинстве случаев они не отражают какую-то «более глубокую интуицию» или «структуру» - они просто существуют (к счастью). $e$

Во-вторых, квадрат переменной очень мало связан с ее уровнем. Просто рассмотрим в, скажем, $f(x) = x$ : $[-2,\,2]$

enter image description here

... или отобразите стандартную нормальную плотность по отношению к плотности хи-квадрат: они отражают и представляют совершенно разные стохастические поведения, даже если они так тесно связаны, поскольку вторая - это плотность переменной, которая является квадратом первой. Нормаль может быть очень важной опорой математической системы, которую мы разработали для моделирования стохастического поведения - но как только вы возводите это в квадрат, оно становится чем-то совершенно другим.

— Алекос Пападопулос
источник

Спасибо за решение, в частности, вопросов в моем последнем абзаце.

— Timxyz

Пожалуйста. Я должен признать, что рад, что мой ответ достиг первоначального ОП через 26 месяцев после опубликования вопроса.

— Алекос Пападопулос

Давайте обратимся к поставленному вопросу: для меня все это несколько загадочно. Является ли нормальное распределение фундаментальным для вывода гамма-распределения ...? На самом деле нет ничего загадочного, просто нормальное распределение и гамма-распределение являются членами, среди прочего, экспоненциального семейства распределений, которое определяется способностью преобразовывать между уравнительными формами путем подстановки параметров и / или переменных. Как следствие, существует много преобразований путем замены между распределениями, некоторые из которых суммированы на рисунке ниже.

LEEMIS, Лоуренс М .; Жаклин Т. Макквестон (февраль 2008 г.). «Однофакторные распределительные отношения» (PDF). Американский статистик. 62 (1): 45–53. DOI: 10,1198 / 000313008x270448 цитировать

Вот два отношения нормального и гамма-распределения более подробно (среди неизвестного числа других, например, через хи-квадрат и бета).

Сначала следует более прямая связь между гамма-распределением (GD) и нормальным распределением (ND) со средним нулем. Проще говоря, GD становится нормальным по форме, так как его параметру формы разрешено увеличиваться. Доказать, что это так, сложнее. Для БД

GD (z; a, b) = \begin{array}{cc} {\begin{cases} \frac{b^{- a} z^{a - 1} e^{- \frac{z}{b}}}{Γ (a)} & z > 0 \\ 0 & other \end{cases} . \end{array}

$\text{GD}(z;a,b)=\begin{array}{cc} & \begin{cases} \dfrac{b^{-a} z^{a-1} e^{-\dfrac{z}{b}}}{\Gamma (a)} & z>0 \\ 0 & \text{other} \\ \end{cases} \,. \\ \end{array}$

$a\rightarrow \infty$ $a$ $(a-1) \sqrt{\dfrac{1}{a}} k$ $b$ $\sqrt{\dfrac{1}{a}}$ .

To wit, to transform a GD to a limiting case ND we set the standard deviation to be a constant ( $k$ ) by letting $b=\sqrt{\dfrac{1}{a}} k$ and shift the GD to the left to have a mode of zero by substituting $z=(a-1) \sqrt{\dfrac{1}{a}} k+x\ .$ Then

GD ((a - 1) \sqrt{\frac{1}{a}} k + x; a, \sqrt{\frac{1}{a}} k) = \begin{array}{cc} {\begin{cases} \frac{{(\frac{k}{\sqrt{a}})}^{- a} e^{- \frac{\sqrt{a} x}{k} - a + 1} {(\frac{(a - 1) k}{\sqrt{a}} + x)}^{a - 1}}{Γ (a)} & x > \frac{k (1 - a)}{\sqrt{a}} \\ 0 & other \end{cases} \end{array} .

$\text{GD}\left((a-1) \sqrt{\frac{1}{a}} k+x;\ a,\ \sqrt{\frac{1}{a}} k\right)=\begin{array}{cc} & \begin{cases} \dfrac{\left(\dfrac{k}{\sqrt{a}}\right)^{-a} e^{-\dfrac{\sqrt{a} x}{k}-a+1} \left(\dfrac{(a-1) k}{\sqrt{a}}+x\right)^{a-1}}{\Gamma (a)} & x>\dfrac{k(1-a)}{\sqrt{a}} \\ 0 & \text{other} \\ \end{cases} \\ \end{array}\,.$

Note that in the limit as $a\rightarrow\infty$ the most negative value of $x$ for which this GD is nonzero $\rightarrow -\infty$ . That is, the semi-infinite GD support becomes infinite. Taking the limit as $a\rightarrow \infty$ of the reparameterized GD, we find

lim_{a \to \infty} \frac{{(\frac{k}{\sqrt{a}})}^{- a} e^{- \frac{\sqrt{a} x}{k} - a + 1} {(\frac{(a - 1) k}{\sqrt{a}} + x)}^{a - 1}}{Γ (a)} = \frac{e^{- \frac{x^{2}}{2 k^{2}}}}{\sqrt{2 π} k} = ND (x; 0, k^{2})

$\lim_{a\to \infty } \, \frac{\left(\frac{k}{\sqrt{a}}\right)^{-a} e^{-\frac{\sqrt{a} x}{k}-a+1} \left(\frac{(a-1) k}{\sqrt{a}}+x\right)^{a-1}}{\Gamma (a)}=\dfrac{e^{-\dfrac{x^2}{2 k^2}}}{\sqrt{2 \pi } k}=\text{ND}\left(x;0,k^2\right)$

Graphically for $k=2$ and $a=1,2,4,8,16,32,64$ the GD is in blue and the limiting $\text{ND}\left(x;0,\ 2^2\right)$ is in orange, below

Second Let us make the point that due to the similarity of form between these distributions, one can pretty much develop relationships between the gamma and normal distributions by pulling them out of thin air. To wit, we next develop an "unfolded" gamma distribution generalization of a normal distribution.

Note first that it is the semi-infinite support of the gamma distribution that impedes a more direct relationship with the normal distribution. However, that impediment can be removed when considering the half-normal distribution, which also has a semi-infinite support. Thus, one can generalize the normal distribution (ND) by first folding it to be half-normal (HND), relating that to the generalized gamma distribution (GD), then for our tour de force, we "unfold" both (HND and GD) to make a generalized ND (a GND), thusly.

The generalized gamma distribution

GD (x; α, β, γ, μ) = \begin{array}{cc} {\begin{cases} \frac{γ e^{- {(\frac{x - μ}{β})}^{γ}} {(\frac{x - μ}{β})}^{α γ - 1}}{β Γ (α)} & x > μ \\ 0 & other \end{cases} \end{array},

$\text{GD}\left(x;\alpha ,\beta ,\gamma ,\mu \right)=\begin{array}{cc} & \begin{cases} \dfrac{\gamma e^{-\left(\dfrac{x-\mu }{\beta }\right)^{\gamma }} \left(\dfrac{x-\mu }{\beta }\right)^{\alpha \gamma -1}}{\beta \,\Gamma (\alpha )} & x>\mu \\ 0 & \text{other} \\ \end{cases} \\ \end{array}\,,$

Can be reparameterized to be the half-normal distribution,

GD (x; \frac{1}{2}, \frac{\sqrt{π}}{θ}, 2, 0) = \begin{array}{cc} {\begin{cases} \frac{2 θ e^{- \frac{θ^{2} x^{2}}{π}}}{π} & x > 0 \\ 0 & other \end{cases} \end{array} = HND (x; θ)

$\text{GD}\left(x;\frac{1}{2},\frac{\sqrt{\pi }}{\theta },2,0 \right)=\begin{array}{cc} & \begin{cases} \dfrac{2 \theta e^{-\dfrac{\theta ^2 x^2}{\pi }}}{\pi } & x>0 \\ 0 & \text{other} \\ \end{cases} \\ \end{array}\,\,\,=\text{HND}(x;\theta)$

Note that $\theta=\frac{\sqrt{\pi}}{\sigma\sqrt{2}}.$ Thus,

ND (x; 0, σ^{2}) = \frac{1}{2} HND (x; θ) + \frac{1}{2} HND (- x; θ) = \frac{1}{2} GD (x; \frac{1}{2}, \frac{\sqrt{π}}{θ}, 2, 0) + \frac{1}{2} GD (- x; \frac{1}{2}, \frac{\sqrt{π}}{θ}, 2, 0),

$\text{ND}\left(x;0,\sigma^2\right)=\frac{1}{2}\text{HND}(x;\theta)+\frac{1}{2}\text{HND}(-x;\theta)=\frac{1}{2}\text{GD}\left(x;\frac{1}{2},\frac{\sqrt{\pi }}{\theta },2,0 \right)+\frac{1}{2}\text{GD}\left(-x;\frac{1}{2},\frac{\sqrt{\pi }}{\theta },2,0 \right)\,,$

which implies that

\begin{aligned} GND (x; μ, α, β) & = \frac{1}{2} GD (x; \frac{1}{β}, α, β, μ) + \frac{1}{2} GD (- x; \frac{1}{β}, α, β, μ) \\ = \frac{β e^{- {(\frac{| x - μ |}{α})}^{β}}}{2 α Γ (\frac{1}{β})} \end{aligned},

$\begin{align} \text{GND}(x;\mu,\alpha,\beta) &= \frac{1}{2}\text{GD}\left(x;\frac{1}{\beta},\alpha,\beta,\mu \right)+\frac{1}{2}\text{GD}\left(-x;\frac{1}{\beta},\alpha,\beta,\mu \right)\\ &= \frac{\beta e^{-\left(\dfrac{\left|x-\mu\right|}{\alpha }\right)^{\mathrm{\Large{\beta}}}}}{2 \alpha \Gamma \left(\dfrac{1}{\beta }\right)}\\ \end{align} \,,$

is a generalization of the normal distribution, where $\mu$ is the location, $\alpha>0$ is the scale, and $\beta>0$ is the shape and where $\beta=2$ yields a normal distribution. It includes the Laplace distribution when $\beta=1$ . As $\beta\rightarrow\infty$ , the density converges pointwise to a uniform density on $(\mu-\alpha,\mu+\alpha)$ . Below is the generalized normal distribution plotted for $\alpha =\frac{\sqrt{\pi} }{2}\,,\beta=1/2,1,4$ in blue with the normal case $\alpha =\frac{\sqrt{\pi} }{2},\,\beta=2$ in orange.

The above can be seen as the generalized normal distribution Version 1 and in different parameterizations is known as the exponential power distribution, and the generalized error distribution, which are in turn one of several other generalized normal distributions.

— Carl
источник

The derivation of the chi-squared distribution from the normal distribution is much analogous to the derivation of the gamma distribution from the exponential distribution.

We should be able to generalize this:

If the $X_i$ are independent variables from a generalized normal distribution with power coefficient $m$ then $Y = \sum_{i}^n {X_i}^m$ can be related to some scaled Chi-squared distribution (with "degrees of freedom" equal to $n/m$ ).

The analogy is as following:

Normal and Chi-squared distributions relate to the sum of squares

The joint density distribution of multiple independent standard normal distributed variables depends on $\sum x_i^2$
$f(x_1, x_2, ... ,x_n) = \frac{\exp \left( {-0.5\sum_{i=1}^{n}{x_i}^2}\right)}{(2\pi)^{n/2}}$
If $X_i \sim N(0,1)$

then $\sum_{i=1}^n {X_i}^2 \sim \chi^2(\nu)$

Exponential and gamma distributions relate to the regular sum

The joint density distribution of multiple independent exponential distributed variables depends on $\sum x_i$

$f(x_1, x_2, ... ,x_n) = \frac{\exp \left( -\lambda\sum_{i=1}^{n}{x_i} \right)}{\lambda^{-n}}$
If $X_i \sim Exp(\lambda)$

then $\sum_{i=1}^n X_i \sim \text{Gamma}(n,\lambda)$

The derivation can be done by a change of variables integrating not over all $x_1,x_2,...x_n$ but instead only over the summed term (this is what Pearson did in 1900). This unfolds very similar in both cases.

For the $\chi^2$ distribution:

\begin{array}{rcl} f_{χ^{2} (n)} (s) d s & = & \frac{e^{- s / 2}}{{(2 π)}^{n / 2}} \frac{d V}{d s} d s \\ = & \frac{e^{- s / 2}}{{(2 π)}^{n / 2}} \frac{π^{n / 2}}{Γ (n / 2)} s^{n / 2 - 1} d s \\ = & \frac{1}{2^{n / 2} Γ (n / 2)} s^{n / 2 - 1} e^{- s / 2} d s \end{array}

$\begin{array}{rcl} f_{\chi^2(n)}(s) ds &=& \frac{e^{-s/2}}{\left( 2\pi \right)^{n/2}} \frac{dV}{ds} ds\\ &=& \frac{e^{-s/2}}{\left( 2\pi \right)^{n/2}} \frac{\pi^{n/2}}{\Gamma(n/2)}s^{n/2-1} ds \\ &=& \frac{1}{2^{n/2}\Gamma(n/2)}s^{n/2-1}e^{-s/2} ds \\ \end{array}$

Where $V(s) = \frac{\pi^{n/2}}{\Gamma (n/2+1)}s^{n/2}$ is the n-dimensional volume of an n-ball with squared radius $s$ .

For the gamma distribution:

\begin{array}{rcl} f_{G (n, λ)} (s) d s & = & \frac{e^{- λ s}}{λ^{- n}} \frac{d V}{d s} d s \\ = & \frac{e^{- λ s}}{λ^{- n}} n \frac{s^{n - 1}}{n!} d s \\ = & \frac{λ^{n}}{Γ (n)} s^{n - 1} e^{- λ s} d s \end{array}

$\begin{array}{rcl} f_{G(n,\lambda)}(s) ds &=& \frac{e^{-\lambda s}}{\lambda^{-n}} \frac{dV}{ds} ds\\ &=& \frac{e^{-\lambda s}}{\lambda^{-n}} n \frac{s^{n-1}}{n!}ds \\ &=& \frac{\lambda^{n}}{ \Gamma(n)} s^{n-1} e^{-\lambda s} ds \\ \end{array}$

Where $V(s) = \frac{s^n}{n!}$ is the n-dimensional volume of a n-polytope with $\sum x_i < s$ .

The gamma distribution can be seen as the waiting time $Y$ for the $n$ -th event in a Poisson process which is the distributed as the sum of $n$ exponentially distributed variables.

As Alecos Papadopoulos already noted there is no deeper connection that makes sums of squared normal variables 'a good model for waiting time'. The gamma distribution is the distribution for a sum of generalized normal distributed variables. That is how the two come together.

But the type of sum and type of variables may be different. While the gamma distribution, when derived from the exponential distribution (p=1), gets the interpretation of the exponential distribution (waiting time), you can not go reverse and go back to a sum of squared Gaussian variables and use that same interpretation.

The density distribution for waiting time which falls of exponentially, and the density distribution for a Gaussian error falls of exponentially (with a square). That is another way to see the two connected.

— Sextus Empiricus
источник