Хороший вопрос (+1) !!
Вы помните, что для независимых случайных величин и , и . Таким образом, дисперсия равна , а дисперсия ˉ X = 1XXYYVar(X+Y)=Var(X)+Var(Y)Var(X+Y)=Var(X)+Var(Y)Var(a⋅X)=a2⋅Var(X)Var(a⋅X)=a2⋅Var(X)∑ni=1Xi∑ni=1Xi∑ni=1σ2=nσ2∑ni=1σ2=nσ2n ∑ n i = 1 XiX¯=1n∑ni=1Xiявляетсяnσ2/n2=σ2/nnσ2/n2=σ2/n.
Это для дисперсии . Чтобы стандартизировать случайную величину, вы делите ее на стандартное отклонение. Как известно, ожидаемое значение ˉ XX¯ равно μμ , поэтому переменная
ˉ X -E( ˉ X )√V a r ( ˉ X ) =√n ˉ X - μσ
X¯−E(X¯)Var(X¯)−−−−−−√=n−−√X¯−μσ
имеет ожидаемое значение 0 и дисперсию 1. Поэтому, если он стремится к гауссову, он должен быть стандартным гауссовским
N(0,1 )N(0,1) . Ваша формулировка в первом уравнении эквивалентна. Умножая левую часть на
σ,σ вы устанавливаете дисперсию
σ 2σ2 .
Что касается вашего второго пункта, я полагаю, что приведенное выше уравнение показывает, что вы должны делить на σ,σ а не на √σσ−−√ стандартизировать уравнение, объясняя, почему вы используетеsnsn(оценщикσ),σ)а не √с нsn−−√ .
Дополнение: @whuber предлагает обсудить причину масштабирования √пn−−√ . Он делает этотам, но поскольку ответ очень длинный, я попытаюсь уловить суть его аргумента (который является реконструкцией мыслей де Мойвра).
Если вы добавите большое число nn из +1 и -1, вы можете приблизить вероятность того, что сумма будет j,j путем элементарного подсчета. Лог этой вероятности пропорционален - j 2 / n−j2/n . Поэтому, если мы хотим, чтобы приведенная выше вероятность сходилась к константе, когда nn становится большим, мы должны использовать нормирующий множитель в O ( √н )O(n−−√).
Using modern (post de Moivre) mathematical tools, you can see the approximation mentioned above by noticing that the sought probability is
P(j)=(nn/2+j)2n=n!2n(n/2+j)!(n/2−j)!
P(j)=(nn/2+j)2n=n!2n(n/2+j)!(n/2−j)!
which we approximate by Stirling's formula
P(j)≈nnen/2+jen/2−j2nen(n/2+j)n/2+j(n/2−j)n/2−j=(11+2j/n)n+j(11−2j/n)n−j.
P(j)≈nnen/2+jen/2−j2nen(n/2+j)n/2+j(n/2−j)n/2−j=(11+2j/n)n+j(11−2j/n)n−j.
log(P(j))=−(n+j)log(1+2j/n)−(n−j)log(1−2j/n)∼−2j(n+j)/n+2j(n−j)/n∝−j2/n.
log(P(j))=−(n+j)log(1+2j/n)−(n−j)log(1−2j/n)∼−2j(n+j)/n+2j(n−j)/n∝−j2/n.