Байесовские неинформативные априоры против частых нулевых гипотез: каковы отношения?


11

Я наткнулся на это изображение в блоге здесь .

Кто-то в моховой яме испытывает EUREKA!  момент

Я был разочарован тем, что чтение заявления не выявило для меня того же выражения лица, что и для этого парня.

Итак, что подразумевается под утверждением о том, что нулевая гипотеза состоит в том, как часто участники выражают неинформативный априор? Это правда?


Редактировать: Я надеюсь, что кто-то может предложить благотворительную интерпретацию, которая делает это утверждение правдой, даже в некотором бесполезном смысле.


3
Я не думаю, что это точно. Во-первых, кто-то может записать вероятность Т-теста? Тогда мы можем начать говорить об аналогиях. Ну, а если ты не сможешь ... нам эта картина не имеет смысла.
joint_p

Ответы:


10

Нулевая гипотеза не эквивалентна байесовскому неинформативному предшествующему по той простой причине, что байесовцы могут также использовать нулевые гипотезы и выполнять проверки гипотез, используя байесовские факторы. Если бы они были эквивалентны, байесовцы не использовали бы нулевые гипотезы.

Тем не менее, тестирование гипотезы как частое, так и байесовское включают элемент самоскептицизма, поскольку мы должны показать, что есть некоторые доказательства того, что наша альтернативная гипотеза в некотором роде является более правдоподобным объяснением наблюдений, чем случайный случай. Часто это достигается благодаря уровню значимости, а байесовцы - по шкале интерпретации для байесовского фактора, так что мы бы не стали широко выдвигать гипотезу, если бы байесовский фактор по нулевой гипотезе не был достаточно высоким.

Теперь причина, по которой тесты на гипотезы часто используются контр-интуитивно, заключается в том, что частый человек не может приписать нетривиальную вероятность истинности гипотезы, которая, к сожалению, обычно является тем, чего мы на самом деле хотим. Самое близкое, что они могут получить к этому, - это вычислить значение p (вероятность наблюдений при H0) и затем сделать из этого субъективный вывод относительно того, являются ли H0 или H1 правдоподобными. Байесовский может присвоить вероятность истинности гипотезы, и, таким образом, может определить соотношение этих вероятностей, чтобы указать на их относительную правдоподобность или, по крайней мере, на то, как наблюдения изменяют отношение этих вероятностей (что является Байесовский фактор делает).

На мой взгляд, плохая идея - пытаться провести слишком тесную параллель между частыми и байесовскими методами проверки гипотез, поскольку они принципиально различны и отвечают на принципиально разные вопросы. Отношение к ним как к эквивалентным поощряет байесовскую интерпретацию теста на частоту (например, ошибочное значение p), который потенциально опасен (например, климатические скептики часто предполагают, что отсутствие статистически значимой тенденции глобальной средней температуры поверхности означает, что не было потепления - что совсем не правильно).


9

Причина, по которой ты не выглядишь так же эпифанично, как у этого парня, в том, что я так думаю. , , утверждение не соответствует действительности.

Нулевая гипотеза - это гипотеза о том, что любое различие между контрольными и экспериментальными условиями обусловлено случайностью.

Под неинформативным априором подразумевается, что у вас есть предварительные данные по вопросу, но ничего не сказано о том, чего ожидать в следующий раз. Байесовский, вероятно, будет утверждать, что есть информация в любом предыдущем, даже равномерном распределении.

Таким образом, нулевая гипотеза говорит, что нет разницы между контролем и экспериментом; неинформативный априор с другой стороны может или не может быть возможным, и если бы он это сделал, это ничего не указывало бы на разницу между контролем и экспериментом (что отличается от указания на то, что любая разница обусловлена ​​случайностью).

Возможно, мне не хватает понимания неинформативных приоров. Я с нетерпением жду других ответов.


2
Я бы только добавил, что неинформативные априоры больше связаны с отношением исследователя, чем с какими-либо особенно интересными свойствами самого дистрибутива. Именно об этом и говорит Гельман в Байесовском анализе данных, хотя я не могу найти номер страницы.
Sycorax говорит восстановить Монику

7
Нулевая гипотеза не всегда одинакова. Нулевая гипотеза - это просто альтернативная «скучная» гипотеза, которую вы сравниваете со своей «интересной» гипотезой, чтобы увидеть, поддерживают ли данные одно над другим. На самом деле, «нет разницы» - это на самом деле плохая нулевая гипотеза, так как вы знаете, априори это неверно. Лучше "разница ниже некоторого порога моей заботы".
Stumpy Джо Пит

Спасибо за ответ @Krysta, и у меня в основном были те же мысли к заявлению, но, может быть, есть смысл, в котором утверждение является своего рода правдой?
Джерад

Мое лучшее предположение состоит в том, что нулевая гипотеза является отправной точкой для часто встречающихся, или пустой набор гипотез ?; возможно, этот автор думает, что неинформативный априор является отправной точкой для байесов, но регулярный информативный априор является лучшим аналогом, если они это имели в виду. Нулевая гипотеза и неинформативный априор до сорта имеют концептуальное сходство - они оба предполагают отсутствие информации / эффекта. Но это довольно расплывчато!
Крыста

«Байесовец, вероятно, будет утверждать, что есть информация в любом предшествующем». Но Джефрис до этого неинформативен.
Нил Г

4

Смотрите эту статью в Википедии :

Для случая одного параметра и данных, которые могут быть сведены в одну достаточную статистику, можно показать, что вероятный интервал и доверительный интервал совпадут, если неизвестный параметр является параметром местоположения (...) с априорной является равномерным плоским распределением (...), а также, если неизвестный параметр является масштабным параметром (...) с приоритетом Джеффриса.

На самом деле, ссылки на Джейнса:

Джейнс, ET (1976), доверительные интервалы против байесовских интервалов .

На странице 185 мы можем найти:

Если возникает случай (I) (и это происходит чаще, чем предполагалось), байесовский и ортодоксальный тесты приведут нас к точно таким же результатам и к одному и тому же выводу с устным несогласием относительно того, следует ли нам использовать «вероятность» или « Значение ", чтобы описать их.

Итак, на самом деле есть подобные случаи, но я бы не сказал, что утверждение на изображении является правдой, если вы, например, используете распределение Коши в качестве вероятности ...


4

Я тот, кто создал графику, хотя, как отмечено в сопроводительном посте, изначально это не мое понимание. Позвольте мне рассказать о том, как это произошло, и приложить все усилия, чтобы объяснить, как я это понимаю. Реализация произошла во время дискуссии со студентом, который в основном изучил байесовский подход к выводу до этого момента. Он с трудом понимая всю парадигму тестирования гипотезы, и я делаю все возможное , чтобы объяснить это явно путая подход (если учесть «разницу» , чтобы быть отрицательным - как в неравно - тогда стандартный подход нулевой гипотезы является тройным негативом: цель исследователей - показать, что нет никакой разницы). В целом, и, как указано в другом ответе, исследователи обычно ожидают, что существует некоторая разница; то, что они действительно надеются найти, является убедительным доказательством, чтобы "отклонить" нуль. Чтобы быть беспристрастным, они начинают симулировать невежество, как в «Ну, может быть, этот наркотик не оказывает никакого воздействия на людей». Затем они продолжают демонстрировать посредством сбора и анализа данных (если могут), что эта нулевая гипотеза, учитывая данные, была неверным предположением.

Для байесовца это должно показаться запутанной отправной точкой. Почему бы не начать с непосредственного объявления своих предыдущих убеждений и понять, что вы принимаете (и не принимаете), зашифровав его ранее? Ключевым моментом здесь является то, что единообразный априор не являетсятакой же как неинформативный априор. Если я бросаю монету 1000 раз и получаю 500 голов, мой новый априор присваивает одинаковый (одинаковый) вес как головам, так и хвостам, но кривая распределения очень крутая. Я кодирую дополнительную информацию, которая очень информативна! Истинный неинформативный априор (доведенный до предела) не будет иметь никакого веса вообще. По сути, это означает, что, начиная с нуля, и, используя частое выражение, пусть данные говорят сами за себя. Наблюдение, сделанное «Кларенсом», заключалось в том, что частый способ кодирования этого недостатка информации - нулевая гипотеза. Это не совсем то же самое, что неинформативный априор; это частый подход к честному выражению максимального невежества, который не предполагает того, что вы хотите доказать.


2
Нулевая гипотеза, которая часто встречается, не выражает максимального невежества, она начинает предполагать, что нулевая гипотеза верна, и мы должны приступить к альтернативной гипотезе, только если наблюдения достаточно маловероятны при H0. Можно утверждать, что тестирование нулевой гипотезы кодирует некоторый предыдущий, но это определенно информативный. По моему мнению, попытка интерпретировать тестирование гипотезы с помощью частых выражений в байесовских терминах ошибочна и является причиной ошибки; они не являются ответами на один и тот же вопрос.
Дикран Marsupial

@Dikran Marsupial, это в какой-то степени бесконечные дебаты, но с точки зрения наиболее частой перспективы я не вижу способа рассматривать ноль как «безусловно информативный». Если бы это было так, то отказ от отклонения нулевого значения будет рассматриваться как доказательство нулевого значения (поскольку у нас «уже» есть информация о нулевом значении). Все подходы к выводу ИМО пытаются ответить на одни и те же взаимосвязанные вопросы: «Как следует интерпретировать данные?» и "насколько сильна ситуация?"
Мэтт Ашер

1
Нуль сам по себе не является информативным или неинформативным, но традиционное частое тестирование гипотез по своей природе (и совершенно справедливо) смещено в сторону H0 (если вы также не выполняете анализ мощности). Это смещение можно сравнить с предыдущим, но оно будет информативным. Просто не имеет смысла сравнивать априорные и гипотезы, они служат различным целям в анализе; Заметьте, что байесовские тесты также используют нулевые гипотезы при проверке гипотез (см. мой ответ на вопрос), где они служат той же цели, что и при тестировании гипотезы с использованием часто используемых методов.
Дикран Сумчатый

3
Чтобы быть ясным, используя пример с наркотиками, мы не начинаем с симуляции невежества «Ну, может быть, этот наркотик не имеет никакого эффекта для людей». Мы начинаем с предположения, что нулевая гипотеза верна «У препарата нет эффекта, и он фармацевтической компании, чтобы установить, что это действительно имеет эффект, показывая, что результаты не могут быть адекватно объяснены случайным образом ». Самоскептицизм, который обеспечивает этот подход, объясняет, почему «нулевой ритуал», несмотря на его многочисленные недостатки, все еще имеет практическую ценность в науке.
Дикран Marsupial
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.