При выборочной съемке необходима стандартная ошибка оценки пропорции. Это зависит больше от меня, чем от j. Также требуется, чтобы открытые бюллетени были выбраны случайным образом. Если p является истинной окончательной пропорцией для кандидата A, тогда дисперсия оценки
( 1 - яJ) p ( 1 - p )я
( 1 - яJ)называется конечным поправочным коэффициентом населения. Для оценки этой дисперсии обычная оценка для p подставляется вместо p в формуле. Стандартная ошибка получается при взятии квадратного корня. При прогнозировании победителя опросчик может использовать оценку плюс или минус 3 стандартных ошибки. Если 0.5 не содержится в интервале, то кандидат A объявляется победителем, если 0.5 ниже нижнего предела, или его оппонент объявляется победителем, если 0.5 выше верхнего предела. Конечно, это только с очень высокой степенью уверенности говорит о том, кто станет победителем в случае, если 0,5 выходит за интервал. Уровень достоверности равен 0,99, если вы используете три стандартные ошибки (на основе нормального приближения к биному). Если 0,5 находится внутри интервала, никто не объявляется победителем, и опросщик ожидает накопления дополнительных данных.
При составлении прогноза участники опроса могут выбрать стратифицированную случайную выборку из накопленных голосов, чтобы избежать потенциального смещения, которое может произойти, если взглянуть на все подсчитанные бюллетени. Проблема с просмотром всех набранных голосов состоит в том, что некоторые избирательные участки полностью подсчитывают другие, и они не могут быть репрезентативными для населения.
Статья здесь дает хорошее освещение проблемы и многочисленные ссылки.
Было отмечено, что накопленные голоса могут обеспечить необъективные оценки пропорций, потому что либо участки, которые еще должны сообщить, являются участками, которые склоняются в пользу партии с кандидатом, который отстает, либо открепительные удостоверения, скорее всего, предпочтут кандидата, который отстает и эти голоса подсчитываются последними. Сложные социологи, такие как Харрис и Гэллап, не попадают в такие ловушки. Простой анализ построения доверительных интервалов на основе накопленных голосов, которые я обрисовал, является лишь одним из используемых факторов. Эти опросчики имеют в своем распоряжении гораздо больше информации. У них есть опросы, которые были проведены незадолго до выборов, и у них есть схемы голосования всех избирательных участков и заочных голосований, полученных на выборах в последние прошлые годы.
Так что, если есть явные предубеждения, которые могут привести к близким выборам в противоположном направлении, избиратели признают это и откладывают прогнозирование победителя.
В США бюллетени для заочного голосования приходят в основном из-за рубежа и студентов колледжей, которые находятся в школе вдали от дома. В то время как военные могут быть более консервативными и склонными голосовать за республиканцев, студенты колледжей, как правило, более либеральны и склонны голосовать за демократов. Все эти соображения приняты во внимание.
Тщательность и изощренность современных опросов являются причиной того, что с тех пор не произошло таких грубых ошибок, как опрос «Литературный дайджест» 1936 года или преждевременная уступка газеты «Чикаго» в выборах 1948 года в Дьюи.