Стандартная ошибка для среднего значения выборки биномиальных случайных величин


44

Предположим, я провожу эксперимент, который может иметь 2 результата, и я предполагаю, что базовое «истинное» распределение 2 результатов - это биномиальное распределение с параметрами и : .npBinomial(n,p)

Я могу вычислить стандартную ошибку, , из формы дисперсии : где . Итак, . Для стандартной ошибки я получаю: , но я где-то видел, что . Что я сделал не так?SEX=σXnBinomial(n,p)

σX2=npq
q=1pσX=npqSEX=pqSEX=pqn

Эта статья очень полезна для понимания стандартной ошибки среднего. Influentialpoints.com/Training/…
Санхьюн Ли,

Из моего поиска в Google, кажется, что тесно связанный предмет получения доверительных интервалов для биномиального распределения довольно нюансирован и сложен. В частности, это выглядит как доверительные интервалы, полученные из этой формулы, которые будут «интервалами Вальда» (см. En.wikipedia.org/wiki/Binomial_proportion_confidence_interval ), довольно плохо себя ведут и их следует избегать. См. Jstor.org/stable/2676784?seq=1#metadata_info_tab_contents для получения дополнительной информации.
водная черепаха

Ответы:


58

Похоже, что вы используете дважды двумя разными способами - и как размер выборки, и как число испытаний Бернулли, составляющих биномиальную случайную величину; чтобы устранить двусмысленность, я буду использовать для обозначения последнего.nk

Если у вас есть независимых выборок из распределения , дисперсия среднего значения выборки равнаnBinomial(k,p)

var(1ni=1nXi)=1n2i=1nvar(Xi)=nvar(Xi)n2=var(Xi)n=kpqn

где и - это одно и то же среднее. Это следует сq=1pX¯

(1) , для любой случайной величины, , и любой постоянной .var(cX)=c2var(X)cXc

(2) дисперсия суммы независимых случайных величин равна сумме дисперсий .

Стандартная ошибка - это квадратный корень из дисперсии: . Следовательно,X¯kpqn

  • Когда , вы получаете формулу, которую вы указали:k=npq

  • Когда , а биномиальные переменные являются всего лишь испытаниями Бернулли , вы получаете формулу, которую вы видели в другом месте:k=1pqn


3
Если - случайная величина Бернулли , то . Когда имеет биномиальную случайную величину, основанную на испытаниях с вероятностью успеха , тогдаv a r ( X ) = p q X n p v a r ( X ) = n p qXvar(X)=pqXnpvar(X)=npq
Макрос

2
Благодарность! Вы сняли мое замешательство. Извините, что это было так элементарно, я все еще учусь :-)
Фрэнк

6
Так ясно ли Фрэнку, что мы используем тот факт, что для любой константы c Var (cX) = c Var (x)? Так как примерная оценка пропорции X / n, мы имеем Var (X / n) = Var (X) / n = npq / n = pq / n и SEx - это квадратный корень из этого. Я думаю, что для всех будет понятнее, если мы изложим все шаги. 2 2222
Майкл Р. Черник

1
@MichaelChernick, я уточнил детали, которые вы упомянули. Основываясь на описании проблемы, я решил, что Фрэнк знал эти факты, но вы правы, что для будущих читателей было бы более полезно включить подробности.
Макро

2
Сол Лаго - В этом случае k = 1. Если вы перевернули монету 50 раз и рассчитали количество успехов, а затем повторили эксперимент 50 раз, то k = n = 50.
Бросок

9

Легко запутать два биномиальных распределения:

  • распределение числа успехов
  • Распределение доли успехов

npq - это число успехов, а npq / n = pq - это соотношение успехов. Это приводит к различным стандартным формулам ошибок.


6

Мы можем посмотреть на это следующим образом:

nYY=i=1nXiXi

XiY

YY

pqpq=1p

Теперь, если мы посмотрим на дисперсию , . Но для всех отдельных экспериментов Бернулли . Поскольку в эксперименте имеется бросков или испытаний Бернулли, . Это означает, что имеет дисперсию .YV(Y)=V(Xi)=V(Xi)V(Xi)=pqnV(Y)=V(Xi)=npqYnpq

Теперь пропорция выборки задается как , что дает «пропорцию успеха или голов». Здесь является константой, так как мы планируем принять одинаковое количество монет для всех экспериментов в популяции.p^=Ynn

Итак, .V(Yn)=(1n2)V(Y)=(1n2)(npq)=pq/n

Итак, стандартная ошибка для (пример статистики)p^pq/n


Вы можете использовать латексный набор текста, вкладывая доллары в математику, например, $x$дает . x
Серебряная рыба

Обратите внимание, что шаг действительно заслуживает некоторого оправдания! V(Xi)=V(Xi)
Серебряная рыба

В последнем выводе есть опечатка, V (Y / n) = (1 / n ^ 2) * V (Y) = (1 / n ^ 2) * npq = pq / n должно быть правильным выводом.
Тарашанкар

Извиняюсь, я это ввел при наборе текста. Надеюсь, отсортировано сейчас.
Серебряная рыба

1
Это правда, если не коррелированы - чтобы оправдать это, мы используем тот факт, что испытания предполагаются независимыми. Xi
Серебряная рыба

2

Я думаю, что в первоначальном посте также есть некоторая путаница между стандартной ошибкой и стандартным отклонением. Стандартное отклонение является квадратом дисперсии распределения; Стандартная ошибка - это стандартное отклонение оценочного среднего значения выборки от этого распределения, т. е. разброс средних значений, которые вы бы наблюдали, если бы вы делали эту выборку бесконечно много раз. Первое является внутренним свойством распределения; последнее является мерой качества вашей оценки свойства (среднего) распределения. Когда вы проводите эксперимент из испытаний N Бернуилли для оценки неизвестной вероятности успеха, неопределенность вашего оценочного значения p = k / N после наблюдения k успехов является стандартной ошибкой расчетной доли, sqrt (pq / N), где q = 1 -п. Истинное распределение характеризуется параметром P, истинной вероятностью успеха.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.