Может быть поучительно продемонстрировать этот результат из первых принципов и основных результатов , используя свойства производящих функции кумулянта (точно так же, как в стандартных доказательствах центральной предельной теоремы). Это требует от нас понимания скорости роста обобщенных гармонических чисел для Эти скорости роста хорошо известны и легко получаются путем сравнения с интегралами : они сходятся при и иначе расходятся логарифмически при .
H(n,s)=∑k=1nk−s
s=1,2,….∫n1x−sdxs>1s=1
Пусть и . По определению производящая функция кумулянта (cgf) из равнаn≥21≤k≤n(Xk−1/k)/Bn
ψk,n(t)=logE(exp(Xk−1/kBnt))=−tkBn+log(1+−1+exp(t/Bn)k).
Последовательное разложение правой части, полученное из разложения вокруг , принимает видlog(1+z)z=0
ψk,n(t)=(k−1)2k2B2nt2+k2−3k+26k3B3nt3+⋯+kj−1−⋯±(j−1)!j!kjBjntj+⋯.
Числители дробей являются полиномами от с начальным членом . Поскольку расширение журнала сходится абсолютно для , это расширение сходится абсолютно, когдаkkj−1∣∣−1+exp(t/Bn)k∣∣<1
|exp(t/Bn)−1|<k.
(В случае, когда оно сходится повсюду.) При фиксированном и растущих значениях (очевидная) дивергенция означает, что область абсолютной сходимости растет сколь угодно большой. Таким образом, для любого фиксированного и достаточно большого это разложение абсолютно сходится.k=1knBntn
Таким образом, для достаточно большого , мы можем суммировать отдельного по терму по терму в степенях чтобы получить cgf для ,nψk,nktSn/Bn
ψn(t)=∑k=1nψk,n(t)=12t2+⋯+1Bjn(∑k=1n(k−1−⋯±(j−1)!k−j))tjj+⋯.
Взятие слагаемых в суммы по одному требует от нас оценки выражений, пропорциональныхk
b(s,j)=1Bjn∑k=1nk−s
для и . Используя асимптотику обобщенных гармонических чисел, упомянутых во введении, это легко следует изj≥3s=1,2,…,j
B2n=H(n,1)−H(n,2)∼log(n)
это
b(1,j)∼(log(n))1−j/2→0
и (для )s>1
b(s,j)∼(log(n))−j/2→0
как растет большими. Следовательно, все члены в разложении за пределами сходятся к нулю, откуда сходится к для любого значения . Поскольку сходимость cgf подразумевает сходимость характеристической функции, из теоремы непрерывности Леви мы заключаем, что приближается к случайной переменной, cgf которой равна 2/2 : это стандартная переменная Normal, QED .nψn(t)t2ψn(t)t2/2tSn/Bnt2/2
Этот анализ раскрывает, насколько деликатна сходимость: тогда как во многих версиях центральной предельной теоремы коэффициент равен (для ), здесь коэффициент равен только : сходимость намного медленнее. В этом смысле последовательность стандартизированных переменных «едва-едва» становится нормальной.tjO(n1−j/2)j≥3O(((log(n))1−j/2)
Мы видим эту медленную сходимость в серии симуляций. Гистограммы отображают независимых итераций для четырех значений . Красные кривые представляют собой графики стандартных функций нормальной плотности для наглядности. Хотя, по-видимому, наблюдается постепенная тенденция к нормальности, даже при (где все еще значительно) остается заметная ненормальность, о чем свидетельствует асимметрия (равно в этом образце). (Не удивительно, что асимметрия этой гистограммы близка к , потому что это именно то, что является термином в cgf.)105nn=1000(log(n))−1/2≈0.380.35(log(n))−1/2t3
Вот R
код для тех, кто хотел бы поэкспериментировать дальше.
set.seed(17)
par(mfrow=c(1,4))
n.iter <- 1e5
for(n in c(30, 100, 300, 1000)) {
B.n <- sqrt(sum(rev((((1:n)-1) / (1:n)^2))))
x <- matrix(rbinom(n*n.iter, 1, 1/(1:n)), nrow=n, byrow=FALSE)
z <- colSums(x - 1/(1:n)) / B.n
hist(z, main=paste("n =", n), freq=FALSE, ylim=c(0, 1/2))
curve(dnorm(x), add=TRUE, col="Red", lwd=2)
}