То, что вы хотите найти, - это стандартное отклонение выборочного распределения среднего значения. Т.е. на простом английском языке выборочное распределение - это когда вы выбираете элементов из своего населения, складываете их вместе и делите сумму на . Затем мы находим дисперсию этой величины и получаем стандартное отклонение, взяв квадратный корень из этой дисперсии.нNN
Итак, пусть выбранные вами элементы будут представлены случайными переменными , каждая из которых одинаково распределена с дисперсией . Они независимо выбираются, поэтому дисперсия суммы является просто суммой дисперсий.
σ 2 Var ( п Σ я = 1 X я ) = п Σ я = 1 Var ( X я ) = п Σ я = 1 σ 2 = п σ 2Икся, 1 ≤ i ≤ nσ2
Вар ( ∑я = 1NИкся) = ∑я = 1NВар ( Хя) = ∑я = 1Nσ2= n σ2
Далее мы делим на . В общем, мы знаем, что , поэтому, положив мы имеемVar ( k Y ) = k 2 Var ( Y ) k = 1 / nNVar( к Y) = к2Var( Y)k = 1 / n
Вар (∑Nя = 1ИксяN) = 1N2Вар ( ∑я = 1NИкся) = 1N2n σ2= σ2N
Наконец, возьмите квадратный корень, чтобы получить стандартное отклонение . Если стандартное отклонение популяции отсутствует, в качестве оценки используется стандартное отклонение выборки в результате чего получается .σN--√ssN--√
Все вышесказанное верно независимо от распределения , но возникает вопрос: что вы на самом деле хотите сделать со стандартной ошибкой? Как правило, вы можете захотеть построить доверительные интервалы, и тогда важно назначить вероятность для построения доверительного интервала, который содержит среднее значение.Икся
Если ваши нормально распределены, это легко, потому что тогда распределение выборки также нормально распределено. Можно сказать, что 68% выборок среднего значения будут находиться в пределах 1 стандартной ошибки истинного среднего значения, 95% будут в пределах 2 стандартных ошибок и т. Д.Икся
Если у вас достаточно большая выборка (или меньшая выборка, и значения не слишком ненормальны), вы можете вызвать центральную предельную теорему и сказать, что распределение выборки распределено приблизительно нормально, и ваши вероятностные утверждения также приблизительны.Икся
Примером является оценка доли , где вы рисуете элементов из распределения Бернулли. Дисперсия каждого распределения равна и, следовательно, стандартная ошибка равна (доля оценивается с использованием данных). Чтобы потом сказать, что примерно несколько% выборок находятся в пределах стольких стандартных отклонений от среднего значения, вам необходимо понять, когда распределение выборок примерно нормальное. Повторная выборка из распределения Бернулли такая же, как выборка из биномиального распределения, и одно общее практическое правило - приближаться только тогда, когда и равнынпNИксяр ( 1 - р ) pnpn(1-p)≥5p ( 1 - p ) / n---------√пп рn ( 1 - p )≥ 5, (См. Википедию для более глубокого обсуждения приближения биномиального с нормальным. См. Здесь для рабочего примера стандартных ошибок с пропорцией.)
Если, с другой стороны, ваше распределение выборки не может быть аппроксимировано нормальным распределением, тогда стандартная ошибка намного менее полезна. Например, при очень искаженном асимметричном распределении вы не можете сказать, что один и тот же% выборок будет стандартным отклонением по обе стороны от среднего значения, и вы можете захотеть найти другой способ связать вероятности с выборками.± 1