Этот пост подробно описывает ответы в комментариях к вопросу.
Пусть . Исправьте все длины блока. Такой вектор всегда может быть завершен на ортонормированном базисе (например, с помощью процесса Грамма-Шмидта ). Это изменение базиса (от обычного) является ортогональным: оно не меняет длины. Таким образом, распределениеX=(X1,X2,…,Xn)e1∈Rn(e1,e2,…,en)
(e1⋅X)2||X||2=(e1⋅X)2X21+X22+⋯+X2n
не зависит от . Взятие показывает, что оно имеет такое же распределение, какe1e1=(1,0,0,…,0)
X21X21+X22+⋯+X2n.(1)
Поскольку имеют нормальное значение, они могут быть записаны как times iid стандартных нормальных переменных и их квадраты имеют распределение times . Поскольку сумма независимых распределений равна , мы определили, что распределение является распределениемXiσY1,…,Ynσ2Γ(1/2)n−1Γ(1/2)Γ((n−1)/2)(1)
σ2Uσ2U+σ2V=UU+V
где и являются независимыми. Это хорошо известно , что это отношение имеет бета распределение. (Также смотрите тесно связанный поток в Распределении если Beta и хи-квадрат с градусами .)U=X21/σ2∼Γ(1/2)V=(X22+⋯+X2n)/σ2∼Γ((n−1)/2)(1/2,(n−1)/2)XYX∼(1,K−1)Y∼2K
Так как
X1+⋯+Xn=(1,1,…,1)⋅(X1,X2,⋯,Xn)=n−−√e1⋅X
для единичного вектора мы заключаем, что является раз бета варьируются. Поэтому для он имеет функцию плотностиe1=(1,1,…,1)/n−−√Z(n−−√)2=n(1/2,(n−1)/2)n≥2
fZ(z)=n1−n/2B(12,n−12)(n−z)n−3z−−−−−−−−−√
на интервале (а в противном случае равен нулю).(0,n)
В качестве проверки я смоделировал независимых реализаций для и , их гистограммы и наложил график соответствующей плотности бета (красным цветом). Соглашения отличные.100,000Zσ=1n=2,3,10
Вот R
код Он выполняет моделирование с помощью формулы sum(x)^2 / sum(x^2)
для , где - вектор длины, сгенерированный . Остальное только зацикливание ( , ) и построение графиков ( , ).Zx
n
rnorm
for
apply
hist
curve
for (n in c(2, 3, 10)) {
z <- apply(matrix(rnorm(n*1e5), nrow=n), 2, function(x) sum(x)^2 / sum(x^2))
hist(z, freq=FALSE, breaks=seq(0, n, length.out=50), main=paste("n =", n), xlab="Z")
curve(dbeta(x/n, 1/2, (n-1)/2)/n, add=TRUE, col="Red", lwd=2)
}