Brexit: был ли «отпуск» статистически значимым? [закрыто]


12

В этом посте мы задаем вопрос о природном явлении под названием « попытка человека найти решение путем подсчета голосов» . Конкретный случай такого естественного явления, о котором идет речь в этом вопросе, относится к делу Brexit .

Примечание: вопрос не в политике. Цель состоит в том, чтобы попытаться обсудить такое естественное явление со статистической точки зрения, основанной на наблюдениях.

Конкретный вопрос:

  • Вопрос: Что означает голосование Brexit чтобы уйти ? Например, означает ли это, что общественность действительно хочет покинуть ЕС? Означает ли это просто, что публика не уверена и ей нужно больше времени для размышлений? Или что-то еще?51.9%

Предположение 1: в процессе голосования нет ошибок.


14
Демократия не имеет статистического значения. Результат 51,9% означает, что 51,9% проголосовавших проголосовали за «отпуск». Это не опрос. Те, кто не голосовал, голосовали (не) используя свои ноги. Интерпретация 51,9% как «публика не уверена и ей нужно больше времени на размышления» - просто ложь со статистикой. Брексит произошел с вероятностью 1.
Тим

7
Эта нить обречена быть не статистической, неубедительной и, возможно, даже полемической. Он просто не подходит для этого сайта, независимо от его популярности. У нас есть чат, где живут люди, которые с удовольствием будут участвовать в таких разговорах: зацените!
whuber

2
Я полагаю, что текущее обсуждение сфокусировано на статистике и является хорошим примером интерпретации результатов голосования, поскольку оно относится к статистическому тестированию.
Подрыватель

3
Вы поднимаете важный вопрос: ошибка измерения показателей общественного мнения, таких как опросы. Боюсь, что основной источник ошибок не в размере выборки.
Аксакал

4
ИМХО, это нестатистический вопрос с тонким слоем статистики, чтобы скрыть этот факт. Насколько я понимаю, предположение «в процессе голосования нет ошибок» устраняет все статистические соображения и обязательно направляет дискуссию на то, что «голосование ... означает» в демократии. Это вопрос политической науки и философии, а не статистики.
whuber

Ответы:


17

Я согласен с @Underminer, что нет ошибки выборки, но не потому, что выборка велика, а потому, что выборка не была задействована . Никто не был выбран для голосования. Очевидно, была какая-то незначительная доля людей, которые хотели проголосовать, но не смогли (например, попали в автомобильную аварию в этот день) или сделали недействительные голоса, но это единственная «выборка» здесь.

Результат точный, ошибки нет, так как все население приняло участие в голосовании (некоторые приняли участие, не приняв в нем участия). Некоторые люди решили голосовать, некоторые нет. Некоторые решили проголосовать в отпуске, некоторые нет. Демократия не в статистической значимости, а в том, что действительно произошло . Голосование предназначено не для того, чтобы узнать мнение людей, а для принятия решения. На самом деле, люди иногда голосуют не в соответствии с тем, что они думают, но чтобы проявить или достичь чего-то . Например, на выборах люди могут голосовать не за своего предпочтительного кандидата, а за второго предпочтительного, если считают, что у него больше шансов на победу.


Рассмотрим случай с серой зоной, где голосующее население не очень уверено в том, что для них хорошо. Например, случай с двумя кандидатами, которые почти одинаково хороши. В таком случае, я думаю, те, кто голосует, вероятно, будут несистематически отличаться, так как я думаю, что их голоса могут иметь распределение, близкое к равномерному. Моя цель здесь - не переопределить демократию (политическая тема), а посмотреть, что мы можем сказать о том, был ли Brexit серой зоной?
пещерный человек

2
@caveman, независимо от того, уверены они или нет, важно то, как они проголосовали, поскольку голосование касается фактических голосов. Конечно, некоторые люди не имели четкого мнения, некоторые из них голосовали, а некоторые нет, но это также не имеет значения, поскольку на самом деле важны голоса тех, кто проголосовал.
Тим

Если я правильно понимаю, ваша точка зрения о том, как демократия интерпретирует голоса? Я согласен. Однако я не интерпретирую это так, как это делают политики. Я пытаюсь использовать население, чтобы определить, является ли решение хорошим, плохим или не очень ясным. Это другое использование голосования.
пещерный человек

2
@caveman люди все время меняют свое мнение, психологи написали тысячи статей об этом ... Да, 51,9% не означает, что именно 51,9% британцев уверены на 100% о выходе из ЕС. Люди могут даже не быть уверены в сравнении длин строк ( en.wikipedia.org/wiki/Asch_conformity_experiment ) ...
Тим

1
@Aksakal Я не собираюсь комментировать, кто имеет право голосовать, а кто нет. Я также не собираюсь комментировать, насколько сложно получить необходимые полномочия. Это политика и как таковая, не по теме здесь. Со статистической точки зрения каждый правомочный избиратель имеет определенную вероятность не голосовать. Эта вероятность может зависеть от определенных факторов, которые могут или не могут быть связаны с их предпочтениями, но каждый отвечающий критериям избиратель решает (не) использовать это право по своему усмотрению.
user3697176

9

51,9% - это процент избирателей, которые хотят уйти . Поскольку размер выборки настолько велик (> 33 миллиона), случайной ошибки выборки практически нет.

Статистическая проверка значимости будет пытаться определить , есть ли разница в остаться и отпуск может быть объяснен случайной ошибкой выборки в одиночку, и разница, несомненно , будет значительной (см @ ответа пещерного).

Проблема с этим подходом состоит в том, что статистическая значимость делает очень сильное предположение, что выборка является репрезентативной для всего населения (всей Британии), а не только для тех, кто голосует.

Уровень отсутствия ответов (те, кто не голосует) чрезвычайно важен для определения, хочет ли более половины всей Британии «уйти», и его трудно измерить. Смещение отсутствия ответа создается, когда подгруппы, которые с меньшей вероятностью проголосуют, имеют систематически разные взгляды. Например, исходя из опросов, проведенных на выходе, миллениалы реже голосовали, но с большей вероятностью проголосовали за то, чтобы остаться , что искажает результаты при попытке представить население всей Британии.

По этой причине статистическая значимость тестирования в его традиционном смысле в значительной степени неуместна .


Предположения: нам нужно определить некоторые термины для того, чтобы все это имело смысл и чтобы избежать политического обсуждения того, что пытается достичь голосование. Вот мои определения:

Население: каждый человек, живущий в Британии

Структура выборки: каждый человек, имеющий право голоса, может голосовать

Методология выборки: добровольный ответ, акт голосования участвует в опросе

Образец: лица, которые действительно голосуют

В этой схеме пропорция выборки может использоваться (к лучшему или к худшему), чтобы оценить процент всех людей, которые склоняются к тому, чтобы остаться (или уйти ).


8

Ты спрашиваешь

Что означает уход из Брексита в 51,9%?

Это означает, что 51,9% избирателей проголосовали за уход.

Например, означает ли это, что общественность действительно хочет покинуть ЕС? Означает ли это просто, что публика не уверена и ей нужно больше времени для размышлений? Или что-то еще?

Голоса составляли "оставленных" голосов и "оставшихся" голосов, что означает, что подходящих избирателей не проголосовали и приблизительно миллионов жителей не имеют права голоса. Поскольку ни фактическое собрание избирателей, ни собрание подходящих избирателей не являются «публичными» и не являются репрезентативной (случайной, беспристрастной, выберите подходящее прилагательное) выборкой «публики», 51,9% голосов Brexit не информируют вашего второго и последующие вопросы.17421887161462971293135318

Возможно, можно было создать анкету, отвечающую вашим вопросам. Похоже, что это не было тем, что произошло на референдуме, как осуществлено.


1
Не могли бы вы обсудить значение голосов по отношению к избирателям (то есть не ко всему населению), помимо поверхностного заключения о том, что это означает " 51,9% проголосовали за отпуск "? Интересно, какой объем информации мы можем извлечь из этого.
пещерный человек

4
Caveman, этот комментарий, больше, чем любой другой, демонстрирует, что ваш вопрос не является статистическим. Поскольку 51,9% (вместе с общими подсчетами) составляют все данные в доказательствах об избирателях, и нет никакой неопределенности (если вы не хотите оспаривать точность подсчета, что является отдельной проблемой), ваш отказ от этого ответа подразумевает Вы ищете нестатистические выводы.
whuber

Что, если мы смоделируем Brexit как проблему двоичной классификации и рассмотрим избирателей как оценки классификаторов, которые являются членами ансамбля. В этой модели цель состоит не в том, чтобы определить, чего хочет большинство граждан, а в том, чтобы определить оптимальный классификатор из пространства классификаторов. Затем мы можем использовать некоторые меры для проверки работоспособности такого ансамбля классификаторов, основанного на правах избирателей. Например, мы можем использовать недоумение или что-то еще, что подходит для этой задачи бинарной классификации, где основная истина неизвестна (например, мы явно не знаем, лучше ли уйти, чем остаться).
пещерный человек

@caveman: Учитывая, что основная истина (правильно) неизвестна, какую метрику вы бы использовали, чтобы «определить оптимальный классификатор из пространства классификаторов»? Любая такая метрика кодирует отклонения аналитика, который выбирает метрику, за исключением метрики, «воспроизводящей результат голосования», для которой для метрики вы уже знаете ответ: 51,9% / 48,1%.
Эрик Тауэрс

@EricTowers Я рассказал об этом на policy.stackexchange.com, где я рассказал о различных методах - policy.stackexchange.com/questions/11433/…
пещерный человек

2

TL; DR

Я смоделировал неуверенную популяцию ниже (под деталями ) для раз, а затем измерил вероятность наблюдения за отпуском в размере при такой неуверенной имитированной популяции. Это дало мне смоделированную вероятность того, что неуверенное население сможет достичь разрешения на голосование, которое составляет или более.R=100051.9%51.9%

Эта моделируемая вероятность отпуска под неуверенным населением равна .0

Может быть излишними, но я также сделал то же самое , но с остается измерить вероятность того, что такое неуверенное население , чтобы получить голоса остаются .48.1%

Эта моделируемая вероятность остаться под неуверенным населением также равна .0

Поэтому я прихожу к выводу, что голосование Brexit не является шумным побочным эффектом неуверенного или растерянного населения. Кажется, есть систематическая причина, побуждающая их покинуть ЕС.

Я загрузил код симулятора здесь: https://github.com/Al-Caveman/Brexit

Детали

Учитывая предположение 1 , возможные ответы (или гипотезы):

  • H0 : Общественность неуверен .
  • H1 : публика уверенно хочет уйти .

Примечание: что это невозможно , что публика уверенно хочет остаться , потому что мы исключили ошибки голосования.

Чтобы ответить на этот вопрос (т. или ), я постараюсь измерить:H0H1

  • Вероятность того, что неуверенное население сможет достичь голосов, оставленных на выборах.51.9%
  • Или вероятность того, что неуверенное население сможет достичь остается голосующей.151.9%

Если эта вероятность достаточно мала, мы можем сделать вывод, что публика уверенно хочет уйти (то есть ). Однако, если эта вероятность достаточно велика, мы можем сделать вывод, что публика не уверена в том, что решит вопрос о Brexit (то есть ).H1H0

Чтобы измерить эту вероятность, нам нужно знать распределение неуверенного британского населения в такой бинарной системе голосования, как Brexit. Поэтому мой первый шаг к этому - смоделировать это распределение, следуя предположению ниже:

  • Предположение 2: население, состоящее из неуверенных людей, будет иметь случайный выборочный голос. Т.е. каждый возможный ответ имеет равные шансы быть выбранным.

На мой взгляд, это предположение справедливо / разумно.

Кроме того, мы моделируем кампании отпуска и оставления как два отдельных процесса следующим образом:

  • Обработайте с выводом .PleaveOleave=[l1,l2,,ln]
  • Обработайте с выводом .PremainOremain=[r1,r2,,rn]

где:

  • n - общая численность населения Великобритании (включая не избирателей).
  • Для любого , . Выходное значение означает , что избиратель проголосовал не за процесс предмета, и значимостей , что избиратель проголосовал да за тот же процесс.i{1,2,,n}li,ri{0,1}01

с учетом следующего ограничения:

  • Для любого , и не могут быть одновременно . Т.е. обязательно подразумевает, что , а обязательно подразумевает, что . Это связано с тем, что избиратель среди населения не может голосовать как уйти, так и остаться одновременно.i{1,2,,n}liri1li=1ri=0ri=1li=0i{1,2,,n}

Например, если , это означает , что из населения , один проголосовал да , чтобы оставить и два не проголосовали не для покинуть .Oleave=[1,0,0]3

Аналогично, если , это означает , что из населения , один проголосовал да , чтобы остаться и два не голосовали не по - прежнему .Oremain=[0,1,0]3

Обратите внимание, что в обоих приведенных выше примерах есть один член населения, который не голосовал ни за один из процессов (или кампаний). В частности, третий избиратель (то есть ).Oleave[3]=Oremain[3]=0

Отсюда мы знаем , что из бюллетеней для голосования проголосовали за выход из ЕС (т.е. проголосовали за то, чтобы остаться ). Это означает:33,568,18451.9%10051.9=48.1%

  • n=33,568,184 .
  • 33,568,184×0.519=17,421,887.496 проголосовали да в отпуск кампании. Т.е.
    i=133,568,184Oleave[i]=17,421,887.49617,421,887
  • 33,568,184×(10.519)=16,146,296.504 проголосовал да к прежней кампании. Т.е.
    i=133,568,184Oremain[i]=16,146,296.50416,146,297

Поэтому мы определяем выходные массивы следующим образом:

  • Для всех , .i{1,2,,17421887}Oleave[i]=1
  • Для всех , .i{17421887+1,17421887+2,,33568184}Oleave[i]=0
  • Для всех , .i{1,2,,17421887}Oremain[i]=0
  • Для всех , .i{17421887+1,17421887+2,,33568184}Oremain[i]=1
  • По предположению 2 для всех , , где - равномерно распределенная случайная величина, которая принимает значения в (например, честное подбрасывание монеты), а - это число, которое идентифицирует конкретную случайную реализацию . Другими словами, вероятность того, что два разных случайных экземпляра равны друг другу, то есть , равна .i{1,2,,33568184}Ounsure,m[i]=CC{0,1}mOunsure,mOunsure,mOunsure,1=Ounsure,20.533,568,184

Наконец, мы определяем значение отпуска процесса следующим образом : где - общее количество раундов моделирования, по которым в каждый момент времени случайный экземпляр определено.pleave

pleave=1Rm=1R{1if (i=133,568,184Oleave[i])(i=133,568,184Ounsure,m[i])0else
ROunsure,m

Аналогично, мы определяем значение для оставшегося процесса следующим образом: premain

premain=1Rm=1R{1if (i=133,568,184Oremain[i])(i=133,568,184Ounsure,m[i])0else

Чтобы ответить на это, я смоделировал вышеизложенное в C, используя и получился результат:R=1,000

total leave votes: 17421887
total remain votes: 16146297
simulating p values............ ok
p value for leave: 0.000000
p value for remain: 0.000000

Другими словами:

  • pleave=0 .
  • premain=0 .

2
Возможно, более важным в этом случае является коэффициент отсутствия ответов (то есть лиц, которые не голосуют). Допустимая погрешность (или показатель статистической значимости) учитывает только ошибку случайной выборки. Смещение без ответа НЕ включено в это, и это намного более эффективно, чем случайная ошибка выборки с опросом с таким большим размером выборки.
Подрыватель

Здесь говорится, что в Великобритании избирателей. Значение не голосовали. Любая идея, как интерпретировать такое не голосующее население? Источник: en.wikipedia.org/wiki/…46,499,53746,499,537(17421887+16146297)=12,931,353
пещерный человек

3
Не существует статистически удовлетворительного способа справиться с неслучайно отсутствующими данными.
Подрыватель

Те, кто не голосовал, могут состоять из людей, которым нет дела до политики (например, больше нет доверия). В качестве альтернативы, такими могут быть те, кто не был уверен в этом. Или это может быть смесь двух. Что произойдет, если мы предположим, что « все неуверенные люди не уверены »? Будет ли это верхним пределом для проверки того, была ли текущая ситуация такой, когда публика чувствовала, что Brexit - это серая зона ?
пещерный человек

3
Здесь возникает путаница относительно характера и объема статистики. Вы пытаетесь создать процесс модель голосования, и как это может сообщить механизмы & обоснованность управления и государственных решений. Это стоящая задача в политологии . Это просто не статистика (хотя статистика задействована).
gung - Восстановить Монику

1

Вы могли бы задать немного другой вопрос: если предположить, что 50% очень большой популяции проголосовали "Да", а вы задали случайную выборку размера S, какова вероятность того, что 51,9% вашей выборки ответили "Да", в зависимости от размер образца?

Ожидаемое значение числа голосов «за» составляет 0,5 S. Разница составляет 0,25 S. Стандартное определение - 0,5 . Отклонение фактического от ожидаемого числа голосов «Да» более чем на 6,1 стандартного отклонения имеет шанс одного на миллиард.S1/2

Мы имеем это, когда 0,019 S (разница между 50% и 51,9%) составляет 6,1 * 0,5 * , или S = или S ≈ 25 800. S1/2(6.10.5/0.019)2


0

Это еще одно решение с использованием аналитического метода вместо моделирования.

Ранее я симулировал неуверенное население, которое будет голосовать за случайные шансы. Таким образом, из большого количества избирателей, неуверенное население склонно голосовать за отпуск или оставаться в течение времени.n0.5

Для того чтобы неуверенное население получило в отпуск ровно голосов , в должно быть единиц . Вероятность этого составляет . Точно так же вероятность получения голос также равна . Это продолжается.51.9%17,421,887Oleave0.533,568,18417,421,887+10.533,568,184

Это вероятность получения голосов: 17,421,887

i=17,421,88733,568,1840.533,568,184=(33,568,18417,421,887)×0.533,568,184=8.39663381928984×10101050240

( рассчитано Вольфрамальфой )8.39663381928984×1010105024

И это вероятность наличия от с неуверенным населением голосования отпуска .51.9%

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.