Как работает стандартная ошибка?


17

Недавно я изучил внутреннюю работу стандартной ошибки и не смог понять, как она работает. Мое понимание стандартной ошибки заключается в том, что это стандартное отклонение распределения выборочных средних. Мои вопросы:

• как мы узнаем, что стандартная ошибка означает стандартное отклонение выборки, когда мы обычно берем только одну выборку?

• почему уравнение для расчета стандартной ошибки не отражает уравнение стандартного отклонения для одной выборки?


Когда вы говорите «одна выборка», вы имеете в виду один набор выборок или действительно размер выборки 1?
Эрик

1
Они объяснены для простой, но интересной проблемы (тройной ответ) на простом нестатистическом языке по адресу stats.stackexchange.com/a/18609 .
whuber

Ответы:


13

Да, стандартная ошибка среднего (SEM) - это стандартное отклонение (SD) среднего. (Стандартная ошибка - это еще один способ сказать SD о распределении выборки. В этом случае распределение выборки - это средство для выборок фиксированного размера, скажем, N.) Существует математическая связь между SEM и популяцией SD: SEM = популяция SD / квадратный корень из N. Это математическое соотношение очень полезно, так как у нас почти никогда нет прямой оценки SEM, но у нас есть оценка SD населения (а именно SD нашей выборки). Что касается вашего второго вопроса, если бы вы собирали несколько выборок размера N и вычисляли среднее значение для каждой выборки, вы могли бы оценить SEM, просто вычислив SD средних. Таким образом, формула для SEM действительно отражает формулу для SD одного образца.


13

Предположим, что независимы и одинаково распределены. Это ситуация, на которую, я уверен, вы ссылаетесь. Пусть их общим средним будет μ, а их общей дисперсией будет σ 2 .X1,X2,,Xnμσ2

Теперь среднее значение выборки: . Линейность ожидания показывает, что среднее значение X b также равно μ . Предположение о независимости подразумевает, что дисперсия X b является суммой дисперсий ее членов. Каждый такой член X i / n имеет дисперсию σ 2 / n 2 (потому что дисперсия постоянной, умноженная на случайную величину, равна квадрату константы, умноженной на дисперсию случайной величины). У нас есть пXb=iXi/nXbμXbXi/nσ2/n2nтакие переменные распределены одинаково для суммирования, поэтому каждый член имеет ту же дисперсию. В результате мы получаем для дисперсии среднего значения выборки.nσ2/n2=σ2/n

Обычно мы не знаем и поэтому мы должны оценить его по данным. В зависимости от настройки, есть разные способы сделать это. Двумя наиболее распространенными оценками общего назначения σ 2 являются выборочная дисперсия s 2 = 1σ2σ2 и его кратное число,s 2 u =ns2=1ni(XiXb)2(что является несмещенной оценкойσ2). Использование любого из них вместоσ2в предыдущем абзаце и получение квадратного корня дает стандартную ошибку в видеs/su2=nn1s2σ2σ2 илиsu/s/n .su/n


1
Это очень хорошо. Есть ли у вас предложения для книг или чтений, чтобы развить похожие навыки мышления. Благодарю.
q126y

Элегантный ответ!
Цзиньхуа Ван

7

σx¯2=σpop2nj,
σpop2njF
F=nj×sx¯2spooled within group2
sx¯2=j=1nj(x¯jx¯.)2nj1,
with x. being the mean of the group means.

In that we typically believe the null hypothesis is not true, @JoelW.'s point is right, but I work through this point, because I think the clarity it affords is helpful for understanding these issues.


2
I think your comment is basically the same as this one, which was written with less mathematical notation: stats.stackexchange.com/questions/32206/…
Joel W.
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.