Центральная предельная теорема для квадратных корней сумм iid случайных величин


11

Заинтригованный вопросом на math.stackexchange и исследующий его эмпирически, я задаюсь вопросом о следующем утверждении о квадратном корне из сумм iid случайных величин.

Предположим, что - это случайные величины с конечным ненулевым средним и дисперсией и . Центральная предельная теорема гласит: при увеличении . μ σ 2 Y = n i = 1 X i Y - n μX1,X2,,Xnμσ2Y=i=1nXinYnμnσ2 d N(0,1)n

Если , могу ли я также сказать что-то вроде при увеличении ?Z - Z=|Y|nZn|μ|σ24|μ|σ24|μ| d N(0,1)n

Например, предположим, что - это Бернулли со средним и дисперсией , тогда является биномиальным, и я могу смоделировать это в R, скажем, с : p p ( 1 - p ) Y p = 1Xipp(1p)Yp=13

set.seed(1)
cases <- 100000
n <- 1000
p <- 1/3
Y <- rbinom(cases, size=n, prob=p)
Z <- sqrt(abs(Y))

что дает примерно ожидаемое среднее значение и дисперсию дляZ

> c(mean(Z), sqrt(n*p - (1-p)/4))
[1] 18.25229 18.25285
> c(var(Z), (1-p)/4)
[1] 0.1680012 0.1666667

и сюжет QQ, который выглядит близко к гауссову

qqnorm(Z)

введите описание изображения здесь


1
@MichaelM: Спасибо за эти комментарии. Я начал с неотрицательного , но я думал, что интуитивное асимптотическое поведение, которое вы описываете, позволило обобщить большее количество распределений. Моими сюрпризами были: (а) дисперсия квадратного корня из суммы, по-видимому, стремящейся к константе, не зависящей от и (б) появление распределения, которое выглядит очень близко к гауссову. Контрпример был бы желателен, но когда я попробовал другие случаи, которые первоначально казались негауссовыми, дальнейшее увеличение казалось, вернуло распределение к результату типа CLT. Xinn
Генри

Следствием этого является среднеквадратичное (или квадратичное среднее) случайных величин iid, соответствующим образом масштабированное (умноженное на как и среднее арифметическое), также сходится к гауссову распределению при условии, что й момент Основное распределение конечно. n4
Генри

3
Краткий комментарий: утверждение является частным случаем метода Дельта, см. Теорему 5.5.24 в книге «Статистический вывод», выполненной Casella & Berger.
Майкл М

@Michael: Возможно, вы видите что-то, чем я не являюсь в данный момент, но я не думаю, что эта конкретная проблема вписывается в предположения классического метода Дельты (например, как указано в теореме, на которую вы ссылаетесь). Обратите внимание, что не сходится в распределении (нетривиально в ), и поэтому «применение метода Дельты с » не удовлетворяет необходимым требованиям. Однако, как показывает ответ С. Каттералла, он дает полезную эвристику, которая приводит к правильному ответу. YRg(y)=|y|
кардинал

(Я полагаю, что вы могли бы адаптировать доказательство метода Дельты к случаям, аналогичным приведенным выше, чтобы сделать строгую вышеупомянутую эвристику полностью строгой).
Кардинал

Ответы:


14

Сходимость к гауссову действительно является общим явлением.

Предположим, что являются случайными переменными IID со средним значением и дисперсией , и определим суммы . Исправить число . Обычная центральная предельная теорема говорит нам, что как , где это стандартный нормальный cdf. Однако непрерывность ограничительного cdf подразумевает, что у нас также естьX1,X2,X3,...μ>0σ2Yn=i=1nXiαP(Ynnμσnα)Φ(α)nΦ

P(Ynnμσnα+α2σ24μσn)Φ(α)
потому что дополнительный член в правой части неравенства стремится к нулю. Перестановка этого выражения приводит к
P(Yn(ασ2μ+nμ)2)Φ(α)

Взяв квадратные корни и отметив, что означает, что , мы получим Другими словами, . Этот результат демонстрирует сходимость к гауссову в пределе при .μ>0P(Yn<0)0

P(|Yn|ασ2μ+nμ)Φ(α)
|Yn|nμσ/2μdN(0,1)n

Означает ли это, что является хорошим приближением к для больших ? Ну, мы можем сделать лучше, чем это. Как отмечает @Henry, предполагая, что все положительно, мы можем использовать вместе с и приближение , чтобы получить улучшенное приближение как указано в вопросе выше. Также обратите внимание, что у нас все еще есть потому чтоnμE[|Yn|]nE[Yn]=E[Yn]Var(Yn)E[Yn]=nμVar(Yn)σ24μE[|Yn|]nμσ24μ

|Yn|nμσ24μσ/2μdN(0,1)
nμσ24μnμ0 при .n

Возможно, вам придется добавить как чтобы получить мой результатnμnμσ24μ0n
Генри

@Henry Вы можете заменить на для любой константы и это не изменит предельного распределения, но может изменить степень, в которой является хорошим приближением к для конкретного большого . Как вы пришли к ? nμnμkk|Yn|nμkσ/2μN(0,1)nnμσ24μ
С. Каттералл восстановил Монику

У нас есть поэтому . Предполагая, что все положительно, а знаменатель предлагает , и объединение этих приводит к . Var(Z)=E[Z2](E[Z])2E[Z]=E[Z2]Var(Z)E[Z2]=E[Y]=nμ|Yn|nμσ/2μ E[Z]Var(Z)σ24μE[Z]nμσ24μ
Генри

Хорошо, спасибо, я попытался осветить это в своем ответе сейчас.
С. Каттералл восстановил Монику
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.