В статье я нашел формулу для стандартного отклонения размера выборки
где представляет собой среднее диапазон подвыборок (размер 6 ) из основного образца. Как рассчитывается число 2.534 ? Это правильный номер?
В статье я нашел формулу для стандартного отклонения размера выборки
где представляет собой среднее диапазон подвыборок (размер 6 ) из основного образца. Как рассчитывается число 2.534 ? Это правильный номер?
Ответы:
Подобное мультипликативное отношение между ожидаемым диапазоном и стандартным отклонением будет иметь место для любого семейства распределений масштаба расположения, потому что это свойство формы одного распределения. Например, вот сопоставимый график для равномерных распределений:
и экспоненциальные распределения:
Это приближение очень близко к истинному стандартному отклонению выборки. Я написал быстрый скрипт R, чтобы проиллюстрировать это:
x = sample(1:10000,6000,replace=TRUE)
B = 100000
R = rep(NA,B)
for(i in 1:B){
samp = sample(x,6)
R[i] = max(samp)-min(samp)
}
mean(R)/2.534
sd(x)
что дает:
> mean(R)/2.534
[1] 2819.238
>
> sd(x)
[1] 2880.924
Теперь я не уверен (пока), почему это работает, но, по крайней мере, выглядит (по номинальной стоимости), что приближение является достойным.
Изменить: см. Исключительный комментарий @ Whuber (выше) о том, почему это работает