Короче говоря, аргумент Бирнбаума заключается в том, что два общепринятых принципа логически подразумевают, что принцип правдоподобия должен соблюдаться. Контр-аргумент Мейо состоит в том, что доказательство неверно, потому что Бирнбаум неправильно использует один из принципов.
Ниже я упрощаю аргументы до такой степени, что они не очень строгие. Моя цель - сделать их доступными для более широкой аудитории, потому что оригинальные аргументы очень технические. Заинтересованные читатели должны увидеть подробности в статьях, связанных в вопросе и в комментариях.
Для конкретности остановлюсь на случае монеты с неизвестным смещением θ . В эксперименте Е1 мы переворачиваем его 10 раз. В эксперименте Е2 мы переворачиваем его, пока не получим 3 «хвоста». В эксперименте Ем я х мы подбрасываем монету с меткой «1» и «2»: если она получает «1», мы выполняем Е1 ; если он получает «2», мы выполняем Е2 . Этот пример значительно упростит обсуждение и продемонстрирует логику аргументов (оригинальные доказательства, конечно, более общие).
Принципы:
Следующие два принципа широко распространены:
Принцип слабых условий говорит о том, что мы должны сделать такие же выводы, если мы решим выполнить эксперимент Е1 или если мы решим выполнить Ем я х и монета получит «1».
Принцип достаточности говорит, что мы должны сделать одни и те же выводы в двух экспериментах, где достаточная статистика имеет одинаковое значение.
Следующий принцип принят байесовским, но не частым. Тем не менее, Бирнбаум утверждает, что это логическое следствие первых двух.
Принцип правдоподобия говорит, что мы должны сделать одинаковые выводы в двух экспериментах, где функции правдоподобия пропорциональны.
Теорема Бирнбаума:
Скажем, мы выполняем E1 и получаем 7 «голов» из десяти сальто. Функция правдоподобия θ равна . Мы выполняем и переворачиваем монету 10 раз, чтобы получить 3 «хвоста». Функция правдоподобия для равна . Две вероятностные функции пропорциональны.(103)θ7(1−θ)3E2θ(97)θ7(1−θ)3
Бирнбаум рассматривает следующую статистику из в :
где и - числа «голов» и «хвостов» соответственно. Поэтому, что бы ни случилось, сообщает о результате, как если бы он был из эксперимента . Оказывается, что достаточно для в . Единственный нетривиальный случай - это когда и , где мы имеемEmix{1,2}×N2{1,2}×N2T:(ξ,x,y)→(1,x,y),
xyTE1TθEmixx=7y=3
P(Xmix=(1,x,y)|T=(1,x,y))=0.5×(103)θ7(1−θ)30.5×(103)θ7(1−θ)3+0.5×(97)θ7(1−θ)3=(103)(103)+(97).
Все остальные случаи равны 0 или 1, за исключением , что является дополнением к вероятности, приведенной выше. Распределение данного не зависит от , поэтому является достаточной статистикой для .P(Xmix=(2,x,y)|T=(1,x,y))XmixTθTθ
Теперь, согласно принципу достаточности, мы должны заключить то же самое для и в , а из принципа слабой кондициональности мы должны сделать то же самое для в и в , а также для в и в . Таким образом, наш вывод должен быть одинаковым во всех случаях, что является принципом вероятности.(1,x,y)(2,x,y)Emix(x,y)E1(1,x,y)Emix(x,y)E2(2,x,y)Emix
Контр-доказательство Мейо:
Установка Бирнбаума не является смешанным экспериментом, поскольку результат монеты с меткой «1» и «2» не наблюдался , поэтому принцип слабой обусловленности не применим к этому случаю .
Возьмите тест против и сделайте вывод из p-значения теста. В качестве предварительного наблюдения отметим, что значение p в задается биномиальным распределением как приблизительно ; p-значение в определяется отрицательным биномиальным распределением как приблизительно .θ=0.5θ>0.5(7,3)E10.1719(7,3)E20.0898
Здесь важная часть: p-значение в дано как среднее из двух - помните, что мы не знаем статус монеты - то есть приблизительно . Тем не менее, значение p в - там, где наблюдается монета - такое же, как в , то есть приблизительно . Принцип слабой обусловленности имеет место (вывод одинаков для и где монета получает «1»), а принцип правдоподобия - нет. Контрпример опровергает теорему Бирнбаума.T=(1,7,3)Emix 0,1309 ( 1 , 7 , 3 ) E m i x E 1 0,1719 E 1 E m i x0.1309(1,7,3)EmixE10.1719E1Emix
Пенья и Бергер опровергают контр-доказательство Мейо:
Мейо неявно изменил формулировку принципа достаточности: она интерпретирует «те же выводы» как «тот же метод». Взятие p-значения является методом вывода, но не выводом.
Принцип достаточности гласит, что если существует достаточная статистика, то выводы должны быть такими же, но для этого вообще не требуется достаточной статистики. Если это произойдет, это приведет к противоречию, как продемонстрировал Мейо.