Стандартное отклонение стандартного отклонения

Что такое оценка стандартного отклонения стандартного отклонения, если можно предположить нормальность данных?

estimation standard-deviation normality-assumption

Я полагаю, что вы ищете распределение выборочной дисперсии . Это ссылка на раздел на странице Википедии об отклонениях в 16:55, 21 августа 2016 года. Поскольку это ссылка на Википедию, статья может измениться в будущем. Следовательно, раздел может не отражать содержание, на которое этот ответ ссылается после таких изменений. Поэтому ссылка на историческую версию страницы Википедии приведена здесь. Текущая статья о дисперсии найдена [здесь] ( en.wikipedia.org/wik

Ответы:

Пусть . Как показано в этой теме , стандартное отклонение образца стандартное отклонение, $X_1, ..., X_n \sim N(\mu, \sigma^2)$

s = \sqrt{\frac{1}{n - 1} \sum_{i = 1}^{n} (X_{i} - \bar{X})},

$s = \sqrt{ \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \overline{X}) },$

является

S D (s) = \sqrt{E ([E (s) - s]^{2})} = σ \sqrt{1 - \frac{2}{n - 1} \cdot {(\frac{Γ (n / 2)}{Γ (\frac{n - 1}{2})})}^{2}}

${\rm SD}(s) = \sqrt{ E \left( [E(s)- s]^2 \right) } = \sigma \sqrt{ 1 - \frac{2}{n-1} \cdot \left( \frac{ \Gamma(n/2) }{ \Gamma( \frac{n-1}{2} ) } \right)^2 }$

$\Gamma(\cdot)$ $n$ $\overline{X} = \frac{1}{n} \sum_{i=1}^{n} X_i$ $s$ $\sigma$ $\sigma$ $s$ ${\rm SD}(s)$

$E(s) = \sigma \cdot \sqrt{ \frac{2}{n-1} } \cdot \frac{ \Gamma(n/2) }{ \Gamma( \frac{n-1}{2} ) }$

s \cdot \sqrt{\frac{n - 1}{2}} \cdot \frac{Γ (\frac{n - 1}{2})}{Γ (n / 2)}

$s \cdot \sqrt{ \frac{n-1}{2} } \cdot \frac{\Gamma( \frac{n-1}{2} )}{ \Gamma(n/2) }$

$\sigma$ ${\rm SD}(s)$

s \cdot \frac{Γ (\frac{n - 1}{2})}{Γ (n / 2)} \cdot \sqrt{\frac{n - 1}{2} - {(\frac{Γ (n / 2)}{Γ (\frac{n - 1}{2})})}^{2}}

$s \cdot \frac{\Gamma( \frac{n-1}{2} )}{ \Gamma(n/2) } \cdot \sqrt{\frac{n-1}{2} - \left( \frac{ \Gamma(n/2) }{ \Gamma( \frac{n-1}{2} ) } \right)^2 }$

— макрос
источник

+1 Приятно видеть, что спустя почти два года появился не только лучший ответ, но и более полезные детали, чем ссылки в других разделах этой темы.

— whuber

Вы забыли квадраты расстояний в первой формуле?

— Данияр

n

$n$

s \cdot \sqrt{e \cdot (1 - \frac{1}{n})^{n - 1} - 1}

$s\cdot\sqrt{\mathrm{e}\cdot(1-\frac{1}{n})^{n-1}-1}$

Вероятно, стоит отметить, что s (вычисленное в ответе @ Macro иногда упоминается как стандартная ошибка стандартного отклонения выборки.

— Harvey

s / \sqrt{2 (n - 1)}

$s/\sqrt{2(n-1)}$

$X_1,\dots,X_n$ $\sigma^2$ $\hat{\sigma}^2$ $\sigma^2$ $X_1,\dots,X_n$ $\hat{\sigma}$ $\sqrt{E[(\sigma-\hat{\sigma})^2]}$ $\sigma/\sqrt{n}$

— Робин Жирар
источник

Разве это не функция оценки по-прежнему оценки? Я до сих пор не знаю \ sigma, только X_i.

\hat{σ} / n

$\hat{\sigma}/n$

\sqrt{2}

$\sqrt{2}$

\hat{σ} \frac{\sqrt{2}}{2 n}

$\hat{\sigma}\frac{\sqrt{2}}{2n}$

\frac{\hat{σ}}{\sqrt{2 n}}

$\frac{\hat{\sigma}}{\sqrt{2n}}$

-3

@Macro предоставил большое математическое объяснение с уравнением для вычисления. Вот более общее объяснение для менее математических людей.

Я думаю, что терминология «SD of SD» многих сбивает с толку. Про доверительный интервал SD легче думать. Насколько точно стандартное отклонение вы вычисляете по образцу? Случайно вы, возможно, случайно получили данные, которые тесно связаны друг с другом, делая SD образца намного ниже, чем SD населения. Или у вас могут быть случайно полученные значения, которые гораздо более разбросаны, чем общая совокупность, что делает SD выборки выше, чем SD совокупности.

Интерпретация CI SD проста. Начните с общепринятого предположения, что ваши данные были случайно и независимо взяты из распределения Гаусса. Теперь повторите эту выборку много раз. Вы ожидаете, что 95% этих доверительных интервалов будут включать истинную популяционную SD.

Насколько 95% доверительный интервал SD? Конечно, это зависит от размера выборки (n).

n: 95% CI от SD

2: 0,45 * SD до 31,9 * SD

3: 0,52 * SD до 6,29 * SD

5: 0,60 * SD до 2,87 * SD

10: 0,69 * SD до 1,83 * SD

25: 0,78 * SD до 1,39 * SD

50: 0,84 * SD до 1,25 * SD

100: 0,88 * SD до 1,16 * SD

500: 0,94 * SD до 1,07 * SD

Бесплатный веб-калькулятор

— Харви Мотульский
источник

Я могу сделать Монте-Карло, я просто хотел сделать это более научным способом; Тем не менее, вы правы, что дистрибутив не нормальный, поэтому этот sd будет бесполезен для тестирования.

Что бы это ни стоило, меня не устраивает утверждение «доверительный интервал, который составляет 95% ... скорее всего, содержит истинное SD» (или, как указано более явно на связанной странице: «вы можете быть на 95% уверены, что CI, рассчитанный по выборке SD, содержит «истинную популяцию SD»). Я думаю, что эти утверждения флиртуют с укреплением популярного заблуждения, см. Здесь , например, для связанной дискуссии по CV.

— gung - Восстановить Монику

Что значит «я думаю, что и концепция, и терминология« SD of SD »слишком скользкие, чтобы справляться с ними»? Стандартное отклонение выборки является случайной величиной, которая имеет стандартное отклонение.

— Макро

@Macro. Спасибо за ваши комментарии. Я переписал существенно.

— Харви Мотульский

@ Gung. Я переписал, чтобы правильно объяснить доверительный интервал.

— Харви Мотульский