ππNNp
pNπ
CI=[p−k∗sd(p), p+k∗sd(p)]
k
С точки зрения опроса, вы хотите, чтобы ширина вашего доверительного интервала была «низкой». Как правило, опросчики работают с пределом погрешности, который в основном составляет половину CI. Другими словами, . MoE=k∗sd(p)
Вот как мы можем рассчитать : по определению, p = ∑ X i / N, где X i = 1, если избиратель i голосует за кандидата, и 0 в противном случае.sd(p)p=∑Xi/NXi=1i0
Xi
Var(P)=V(∑XiN)=∑V(Xi)N2=Nπ(1−π)N2=π(1−π)N.
Теперь, чтобы оценить погрешность, нам нужно знать
π,которого мы не знаем, очевидно. Но проверка числителя показывает, что «худшая» оценка для
sd(p)в том смысле, что мы получаем «наибольшее» стандартное отклонение, это когда
sd(p)=π∗(1−π)N−−−−−−−−−√
πsd(p) . Поэтому наихудшее стандартное отклонение:
s d ( p ) = √π=0.5sd(p)=0.5∗0.5/N−−−−−−−−−√=0.5/N−−√
NN
Например, для доверительного интервала 95% (т.е. ) и N = 1000k=1.96N=1000
По мере того, как мы увеличиваемN,затраты на опрос возрастают линейно, а выгоды уменьшаются экспоненциально. Это причина, почему опросчики обычно ограничиваютN
[p−1.960.51000−−−−√, p+1.960.51000−−−−√]=[p−0.03, p+0.03]
NNπ=50%