Как найти стандартное отклонение стандартного отклонения выборки от нормального распределения?

Простите, если я что-то упустил довольно очевидное.

Я физик с распределением (по гистограмме), сосредоточенным вокруг среднего значения, которое приближается к нормальному распределению. Важным значением для меня является стандартное отклонение этой гауссовской случайной величины. Как бы я попытался найти ошибку в стандартном отклонении выборки? Я чувствую, что это как-то связано с ошибкой на каждом бине в исходной гистограмме.

— загар
источник

Подсказка предоставляется по адресу stats.stackexchange.com/questions/26924 . В общем, ошибка выборки дисперсии может быть вычислена в терминах первых четырех моментов распределения, и, следовательно, ошибка выборки SD может быть по меньшей мере оценена по этим моментам.

— whuber

Ответы:

Похоже, вы просите вычислить стандартное отклонение стандартного отклонения выборки. То есть вы просите , где ${\rm SD}(s) = \sqrt{ {\rm var}(s) }$

s знак равно \sqrt{\frac{1}{N - 1} Σ_{я знак равно 1}^{N} ({Икс}_{я} - \bar{Икс})},

$s = \sqrt{ \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \overline{X}) },$

и представляет собой выборочное среднее. $X_1, ..., X_n \sim N(\mu, \sigma^2)$ $\overline{X}$

Во-первых, мы знаем из основных свойств дисперсии, что

v a р (s) знак равно Е (s^{2}) - Е (s)^{2}

${\rm var}(s) = E(s^2) - E(s)^2$

Поскольку выборочная дисперсия несмещена, мы знаем . В Почему стандартное отклонение выборки является смещенной оценкой ? , рассчитывается, из чего мы можем сделать вывод $E(s^2) = \sigma^2$ $\sigma$ $E(s)$

Е (s)^{2} знак равно \frac{2 σ^{2}}{N - 1} \cdot {(\frac{Γ (N / 2)}{Γ (\frac{N - 1}{2})})}^{2}

$E(s)^2 = \frac{2 \sigma^2 }{n-1} \cdot \left( \frac{ \Gamma(n/2) }{ \Gamma( \frac{n-1}{2} ) } \right)^2$

следовательно

S D (s) = \sqrt{E (s^{2}) - E (s)^{2}} = σ \sqrt{1 - \frac{2}{n - 1} \cdot {(\frac{Γ (n / 2)}{Γ (\frac{n - 1}{2})})}^{2}}

${\rm SD}(s) = \sqrt{ E(s^2) - E(s)^2 } = \sigma \sqrt{ 1 - \frac{2}{n-1} \cdot \left( \frac{ \Gamma(n/2) }{ \Gamma( \frac{n-1}{2} ) } \right)^2 }$

— макрос
источник

Хорошая точка зрения. Я получил оценку дисперсии s ^ 2. Взятие квадратного корня дает оценку стандартного отклонения s ^ 2. Но вы ответили на фактический вопрос, который должен был получить стандартное отклонение s. Я бы предположил, что по практическим причинам вы должны заменить σ на s, чтобы получить оценку по формуле.

— Майкл Р. Черник

Да, верно, вы можете заменить

на

и это приближение хорошо работает даже для скромных размеров выборки - я провел некоторое тестирование с

σ

$\sigma$

s

$s$

n = 20

$n=20$

— Макрос

Величина имеет распределение хи-квадрат с степенями свободы, когда выборки независимы и распределены с одинаковым нормальным распределением. Эта величина может использоваться для получения доверительных интервалов для дисперсия нормали и ее стандартное отклонение. Если у вас есть необработанные значения, а не только центральное значение бинов, вы можете вычислить . $X=(n-1) s^2/\sigma^2$ $n-1$ $s^2$

Известно, что если имеет распределение хи-квадрат с степенями свободы, то его дисперсия равна . Зная это и тот факт, что мы получаем, что имеет дисперсию, равную $X$ $n-1$ $2(n-1)$ $\mathrm{Var}(cX) = c^2 \mathrm{Var}(X)$ $s^2$ Хотя неизвестно, вы можете приблизить его к и у вас есть приблизительное представление о том, что такое дисперсия .

\frac{2 (n - 1) σ^{4}}{(n - 1)^{2}} = \frac{2 σ^{4}}{n - 1},

$\frac{2(n-1)\sigma^4}{(n-1)^2} =\frac{2\sigma^4}{n-1} \>.$

σ^{4}

$\sigma^4$

s^{4}

$s^4$

s^{2}

$s^2$

— Майкл Р. Черник
источник

Я собирался опубликовать это в начале, но проблема, как я вижу здесь, состоит в том, что

неизвестен. Принимая во внимание этот факт, я не знаю, действительно ли оно приближенно к

если мы даже не знаем размер выборки. Напомню, что можно показать, что у четвертого момента могут быть серьезные проблемы с выбросами.

σ^{2}

$\sigma^2$

s^{4} \approx σ^{4}

$s^4\approx \sigma^4$

— Нестор

- непротиворечивая оценка

(при условии, что

существует), верно @Nesp? Я думаю, что обычно это подразумевается, когда люди говорят «приблизительная» или «грубая идея».

s^{4}

$s^4$

σ^{4}

$\sigma^4$

σ^{4}

$\sigma^4$

— Макрос

Может быть, недостаток сна, но разве это не похоже на круговые рассуждения?

— Нестор

С самого начала мы предполагали, что данные поступают из нормального распределения, поэтому проблем с выбросами нет. Я имел в виду грубо, как предлагает Макро. Я согласен, что размер выборки влияет на то, насколько близко s ^ 4 к σ ^ 4. Но беспокойство о выбросах не основано на Nesp. Если вы за это проголосовали против меня, я думаю, это очень несправедливо. То, что я представил, было стандартным способом оценки стандартного отклонения для s ^ 2, когда данные НОРМАЛЬНО РАСПРЕДЕЛЕНЫ.

— Майкл Р. Черник

@Nesp, Майкл дал последовательную оценку дисперсии стандартного отклонения выборки от нормально распределенной выборки - для больших выборок это будет хорошо - смоделируйте это и узнайте. Я не уверен, почему вы думаете, что это круговые рассуждения.

— Макрос

$\sigma$

$x=(x_1,...,x_n)$ $(\mu,\sigma)$

L (μ, σ) \propto \frac{1}{σ^{n}} \exp (- \frac{1}{2 σ^{2}} \sum_{j = 1}^{n} (x_{j} - μ)^{2})

${\mathcal L}(\mu,\sigma) \propto \dfrac{1}{\sigma^n}\exp\left(-\dfrac{1}{2\sigma^2}\sum_{j=1}^n(x_j-\mu)^2\right)$

$(\hat\mu,\hat\sigma)=(\bar x,s)$ $s=\sqrt{\dfrac{1}{n}\sum_{j=1}^n(x_j-\bar x)^2}$ $\sigma$

R_{p} (σ) = \frac{sup_{μ} L (μ, σ)}{L (\hat{μ}, \hat{σ})} = {(\frac{\hat{σ}}{σ})}^{n} \exp [\frac{n}{2} (1 - {(\frac{\hat{σ}}{σ})}^{2})]

$R_p(\sigma)=\dfrac{\sup_{\mu}{\mathcal L}(\mu,\sigma)}{{\mathcal L}(\hat\mu,\hat\sigma)} = \left(\dfrac{\hat\sigma}{\sigma}\right)^n\exp\left[\dfrac{n}{2}\left(1-\left(\dfrac{\hat\sigma}{\sigma}\right)^2\right)\right]$

$R_p:{\mathbb R}_+\rightarrow (0,1]$ $0.147$ $0.95$ $R$

data = rnorm(30)
n = length(data)
sg = sqrt(mean((data-mean(data))^2))
# Profile likelihood
rp = function(sigma) return( (sg/sigma)^n*exp(0.5*n*(1-(sg/sigma)^2))  )
vec = rvec = seq(0.5,1.5,0.01)
for(i in 1:length(rvec)) rvec[i] = rp(vec[i])
plot(vec,rvec,type="l")
rpc = function(sigma) return(rp(sigma)-0.147)
# Approximate 95% confidence interval
c(uniroot(rpc,c(0.7,0.8))$root,uniroot(rpc,c(1.1,1.3))$root)

$\sigma$ $I=(L,U)$ $\sigma^2$ $I^{\prime}=(L^2,U^2)$

Я думаю, что он действительно хотел стандартное отклонение s.

— Майкл Р. Черник