Не используйте нормальное приближение
Много было написано об этой проблеме. Общий совет - никогда не использовать нормальное приближение (т. Е. Асимптотический / доверительный интервал Вальда), поскольку оно обладает ужасными свойствами покрытия. R код для иллюстрации этого:
library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")
Для малых вероятностей успеха вы можете запросить 95% доверительный интервал, но на самом деле получите, скажем, 10% доверительный интервал!
рекомендации
Так что мы должны использовать? Я полагаю, что текущие рекомендации - это те, которые перечислены в статье Оценка интервалов для биномиальной пропорции Брауна, Кая и DasGupta в Статистической науке 2001, том. 16, нет 2, стр. 101–133. Авторы рассмотрели несколько методов расчета доверительных интервалов и пришли к следующему выводу.
[W] мы рекомендуем интервал Вильсона или интервал Джеффриса с равным хвостом для малых n и интервал, предложенный в Agresti и Coull для больших n .
Интервал Уилсона также иногда называют интервалом оценки , поскольку он основан на инвертировании теста оценки.
Расчет интервалов
Чтобы рассчитать эти доверительные интервалы, вы можете использовать этот онлайн-калькулятор или binom.confint()
функцию из binom
пакета в R. Например, для 0 успехов в 25 испытаниях код R будет иметь вид:
> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
type="central")
method x n mean lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2 bayes 0 25 0.019 0.000 0.073
3 wilson 0 25 0.000 0.000 0.133
Вот bayes
интервал Джеффриса. (Аргумент type="central"
необходим для получения равноправного интервала.)
Обратите внимание, что вы должны решить, какой из трех методов вы хотите использовать, прежде чем вычислять интервал. Глядя на все три и выбирая самый короткий, естественно, вы получите слишком малую вероятность покрытия.
Быстрый, приблизительный ответ
В заключение: если вы наблюдаете ровно ноль успехов в ваших n испытаниях и просто хотите очень приблизительный доверительный интервал, вы можете использовать правило трех . Просто разделите число 3 на n . В приведенном выше примере n равно 25, поэтому верхняя граница равна 3/25 = 0,12 (нижняя граница, конечно, равна 0).