Можно ли доказать нулевую гипотезу?


37

Как говорится в вопросе: возможно ли доказать нулевую гипотезу? Исходя из моего (ограниченного) понимания гипотезы, ответ - нет, но я не могу придумать строгое объяснение этого. Есть ли у вопроса окончательный ответ?


4
Это зависит от того, что вы подразумеваете под «доказать». Как уже говорилось, это философский вопрос, а не статистический, и он не имеет однозначного ответа (хотя, по крайней мере, со времен Дэвида Юма большинство людей ответили бы «нет»).
whuber

Это несколько некорректный вопрос. Нам нужно знать условия, при которых должно появиться это «доказательство».
вероятностная

Возможно, лучше задать вопрос: «При каких условиях / предположениях можно доказать нулевую гипотезу?»
вероятностная

Ответы:


19

Если вы говорите о реальном мире, а не о формальной логике, ответ, конечно, есть. «Доказательство» чего-либо эмпирическим путем зависит от силы вывода, который можно сделать, что, в свою очередь, определяется достоверностью процесса тестирования, оцениваемого в свете всего, что каждый знает о том, как устроен мир (т. Е. Теория). Всякий раз, когда кто-то соглашается с тем, что определенные эмпирические результаты оправдывают отклонение «нулевой» гипотезы, он обязательно делает суждения такого рода (обоснованность замысла; мир работает определенным образом), поэтому приходится делать аналогичные предположения, необходимые для обоснования выводящих «доказательство» ноль " не является проблемой вообще.

Итак, каковы аналогичные предположения? Вот пример «подтверждения нуля», который является обычным явлением в науке о здоровье и в социальных науках. (1) Определите «ноль» или «нет эффекта» каким-либо образом, который практически имеет смысл. Допустим, я считаю, что должен вести себя так, как будто между двумя видами лечения, t1 и t2, нет значимой разницы, если одно не дает на 3% больше шансов на выздоровление, чем другое. (2) Определите действительный дизайн для проверки, есть ли какой-либо эффект - в этом случае, есть ли разница в вероятности восстановления между t1 и t2. (3) Проведите силовой анализ, чтобы определить, необходим ли размер выборки для получения достаточно высокой вероятности - такой, на которую, я уверен, полагаюсь, учитывая, что 'предполагая, что это существует. Обычно люди говорят, что мощности достаточно, если вероятность наблюдения указанного эффекта в указанной альфа-точке составляет не менее 0,80, но правильный уровень достоверности действительно зависит от того, насколько вы склонны к ошибке - так же, как и при выборе p. -значение порога для «отклонения нуля». (4) Выполните эмпирический тест и наблюдайте эффект. Если оно ниже указанного значения «значимой разницы» - 3% в моем примере - вы «доказали», что «никакого эффекта» нет.

Для хорошего рассмотрения этого вопроса, см. Streiner, DL Unicorns Do Exist: Учебное пособие по «доказательству» нулевой гипотезы . Канадский журнал психиатрии 48, 756-761 (2003).


1
+1. Это хороший пример важности ясности в отношении стандарта «доказательства». Во многих приложениях тот, который вы вызываете здесь - стандарт «действуй как будто», если можно так сказать, настолько слаб, что никто не примет это как «доказательство». Однако я не отрицаю его полезности и поддерживаю такой подход для поддержки рационального принятия решений. (Но, возможно, байесовские методы лучше ... :-)
whuber

1
(+1) Хороший ответ. Я добавил ссылку на онлайн-версию статьи Штрайнера; Я надеюсь, что вы не возражаете (не стесняйтесь удалить).
CHL

1
еще пара вещей: (1) Рассмотрение отказа от отклонения нулевого значения в качестве доказательства в поддержку нулевого значения является шокирующе распространенной ошибкой и обычным поводом для высказывания Стрейнера. Эта ошибка по существу превращает сильное отвращение к ошибке типа 1 в норме «p <0,05» в лицензию для создания типа 2. S говорит: «подождите - вам нужна сила ...» (2). Whuber приводит известный аргумент Юма. PT H является на самом деле так же , как подрывной эмпирических доказательств , отвергающих нуль в качестве доказательств в нуль. Н говорит, что индукция не может поддержать причинный вывод. Хорошо; но нет альтернативы для эмпирического изучения! Иди Перл (и Байес), а не Юм, о причинности!
dmk38

1
у этого вопроса о проверке эквивалентности также есть несколько хороших предложений stats.stackexchange.com/questions/3038/…
Джером Энглим,

Является ли это эквивалентным принятию «не ноль» в качестве новой нулевой гипотезы и затем отвергает эту новую нулевую гипотезу?

16

Ответ с математической стороны: это возможно тогда и только тогда, когда «гипотезы взаимно единичны».

Если под «доказать» вы имеете в виду правило, которое может «принять» (я должен так сказать :)) с вероятностью совершить ошибку, равную нулю, то вы ищете то, что можно назвать «идеальным тестом», и это существует :H0

Если вы тестируете, случайная переменная берется из или из (т сравнению с ), тогда существует идеальный тест тогда и только тогда, когда ( и являются "взаимно единичными"). P 0 P 1 H 0 : X XP0P1H0:XP0H1:XP1 P1P0P1P0

Если вы не знаете, что означает «взаимно исключительное», я могу привести пример: и (униформа на и ) взаимно единичны. Это означает, что если вы хотите проверитьU[0,1]U[3,4][0,1][3,4]

H0:XU[0,1] противH1:XU[3,4]

тогда существует идеальный тест (угадайте, что это такое :)): тест, который никогда не ошибается!

Если и не являются взаимно единичными, то этого не существует (это вытекает из «только если часть»)!P1P0

В нематематических терминах это означает, что вы можете доказать нулевое значение в том и только в том случае, если доказательство уже находится в ваших предположениях (т.е. если и только если вы выбрали гипотезу и , которые настолько отличаются, что одно наблюдение из не может быть идентифицировано как один из и наоборот). H0H1H0H1


4
+1 Хороший ответ. Простая интерпретация математики заключается в том, что нулевое значение и его альтернативы предполагают получение непересекающихся наборов результатов; Например, либо в этой комнате есть зебра, либо ее нет. Конечно, слово «доказать» здесь неявно включает «условную модель», которая сама по себе никогда не устанавливается с такой же строгостью, как, скажем, математическая теорема; оно косвенно включает «условность точности наблюдений»; и это подразумевает, что гипотезы могут быть однозначно интерпретированы. (Критику последних можно найти в книге « Женщины, огонь и опасные вещи» Джорджа Лакоффа . )
whuber

11

Да, есть однозначный ответ. Этот ответ: нет, нет способа доказать нулевую гипотезу. Насколько мне известно, лучшее, что вы можете сделать, - это сгенерировать доверительные интервалы вокруг вашей оценки и продемонстрировать, что эффект настолько мал, что он может быть практически несуществующим.


4
В более общем плане проблема статистики заключается не в том, что вы не можете доказать нулевую гипотезу, а в том, что вы не в состоянии сделать какие-либо точечные оценки с уверенностью. То есть, точно так же, как вы не можете сказать, что «переменная не имеет эффекта», вы не можете сказать, что «размер эффекта переменной равен 1,95». Статистика всегда имеет доверительные интервалы.
Russellpierce

1
Договорились, что ответом будет большое НЕТ, и по очень веской причине: по построению статистической гипотезы. Тот факт, что принятый ответ требует иного, абсолютно трагичен. Что проверка гипотезы дает в качестве ответа: если моя гипотеза верна , согласуются ли с ней данные, которые я выбрал? И ни в коем случае не наоборот. Не нужно много рассуждений, чтобы понять, что из этого нельзя сделать вывод, верна ли гипотеза или нет.
Кристоф

4

Для меня теоретическая основа решения представляет собой самый простой способ понять «нулевую гипотезу». В основном это говорит о том, что должно быть как минимум две альтернативы: нулевая гипотеза и как минимум одна альтернатива. Тогда «проблема решения» состоит в том, чтобы принять одну из альтернатив и отвергнуть другие (хотя мы должны быть точными в том, что мы подразумеваем под «принятием» и «отклонением» гипотезы). Я вижу вопрос "можем ли мы доказать нулевую гипотезу?" по аналогии с «мы всегда можем принять правильное решение?». С точки зрения теории решений ответ однозначно да, если

1) нет никакой неопределенности в процессе принятия решения, потому что тогда это математическое упражнение, чтобы выяснить, каково правильное решение.

2) мы принимаем все другие предпосылки / предположения о проблеме. Наиболее важным (я думаю) является то, что гипотеза, между которой мы принимаем решение, является исчерпывающей, и одна (и только одна) из них должна быть истинной, а другие - ложной.

С более философской точки зрения невозможно «доказать» что-либо, в том смысле, что «доказательство» целиком зависит от предположений / аксиом, которые приводят к этому «доказательству». Я рассматриваю доказательство как своего рода логическую эквивалентность, а не как «факт» или «истину» в том смысле, что, если доказательство неверно, предположения, которые привели к нему, также неверны.

Применяя это к «доказательству нулевой гипотезы», я могу «доказать», что это правда, просто предположив, что это правда, или предположив, что это правда, если выполняются определенные условия (такие как значение статистики).


3

Да, можно доказать нулевое значение - точно так же, как можно доказать любую альтернативу нулевому. В байесовском анализе вполне возможно, что шансы в пользу нулевой и любой из предложенных альтернатив ему станут сколь угодно большими. Более того, неверно утверждать, как утверждают некоторые из приведенных выше ответов, что можно доказать нулевое значение, только если альтернативы ему не пересекаются (не перекрываются с нулевым). В байесовском анализе каждая гипотеза имеет предварительное распределение вероятностей. Это распределение распространяет единичную массу априорной вероятности на предложенные альтернативы. Нулевая гипотеза ставит всю предшествующую вероятность на одну альтернативу. В принципе, альтернативы нулю могут поместить всю предшествующую вероятность в некоторую ненулевую альтернативу (в другую «точку»), но это редко. В целом, альтернативы хеджируют, то есть они распространяют ту же массу предшествующей вероятности на другие альтернативы - либо исключая нулевую альтернативу, либо, чаще, включая нулевую альтернативу. Тогда возникает вопрос, какая гипотеза ставит наиболее вероятную вероятность того, что экспериментальные данные действительно падают. Если данные сильно упадут вокруг того, где нулевое значение говорит о том, что они должны упасть, то это будет преимуществом (среди предложенных гипотез), ДАЖЕ, ЧТО ЭТО ВКЛЮЧЕНО (НЕ ВСЕГДА ИСКЛЮЧИТЕЛЬНО С) В АЛЬТЕРНАТИВЫ ЕГО. Вера в то, что вложенная альтернатива не может быть более вероятной, чем набор, в который она вложена, отражает неспособность провести различие между вероятностью и вероятностью. Хотя невозможно, чтобы компонент набора был менее вероятным, чем весь набор, вполне возможно, что задняя вероятность компонента набора гипотез будет больше, чем задняя вероятность набора в целом. Апостериорная вероятность гипотезы является произведением функции правдоподобия и априорного распределения вероятностей, которое устанавливает гипотеза. Если гипотеза помещает всю предшествующую вероятность в правильное место (например, в ноль), то она будет иметь более высокую апостериорную вероятность, чем гипотеза, которая помещает некоторую априорную вероятность в неправильное место (не в ноль). Апостериорная вероятность гипотезы является произведением функции правдоподобия и априорного распределения вероятностей, которое устанавливает гипотеза. Если гипотеза помещает всю предшествующую вероятность в правильное место (например, в ноль), то она будет иметь более высокую апостериорную вероятность, чем гипотеза, которая помещает некоторую априорную вероятность в неправильное место (не в ноль). Апостериорная вероятность гипотезы является произведением функции правдоподобия и априорного распределения вероятностей, которое устанавливает гипотеза. Если гипотеза помещает всю предшествующую вероятность в правильное место (например, в ноль), то она будет иметь более высокую апостериорную вероятность, чем гипотеза, которая помещает некоторую априорную вероятность в неправильное место (не в ноль).


2

Технически, нет, нулевая гипотеза не может быть доказана. Для любого фиксированного конечного размера выборки всегда будет небольшой, но ненулевой размер эффекта, для которого ваш статистический тест практически не имеет силы. Однако на практике вы можете доказать, что вы находитесь в пределах небольшого эпсилона с нулевой гипотезой, так что отклонения меньше этого эпсилона практически не значимы.


2

Есть случай, когда доказательство возможно. Предположим, у вас есть школа, и ваша гипотеза состоит в том, что количество мальчиков и девочек одинаково. По мере увеличения размера выборки неопределенность в соотношении мальчиков и девочек имеет тенденцию уменьшаться, в конечном итоге достигая определенности (что, как я полагаю, вы подразумеваете под доказательством), когда отбирается вся совокупность учеников.

Но если у вас нет конечной совокупности или если вы производите выборку с заменой и не можете определить лиц с повторной выборкой, то вы не можете уменьшить неопределенность до нуля с помощью конечной выборки.


0

Я хотел бы обсудить здесь вопрос, многие пользователи несколько запутались. Каков реальный смысл утверждения о нулевой гипотезе H0: p = 0? Мы пытаемся определить, равен ли параметр p нулю? Конечно, нет, нет возможности достичь такой цели.

Мы намерены установить, что, учитывая набор данных, значение оцениваемого параметра (или нет) неразличимо от нуля. Помните, что NHST является «несправедливым» по отношению к альтернативным гипотезам: нулевому значению приписывается 95% -ый уровень доверия, и только 5% - альтернативе. Следовательно, «несущественный» результат не означает, что H0 выполняется, а просто означает, что мы не нашли достаточных доказательств вероятности альтернативы.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.