Являемся ли мы частыми лицами на самом деле просто неявными / невольными байесовцами?

Для данной проблемы вывода мы знаем, что байесовский подход обычно отличается как по форме, так и по результатам феечистского подхода. Частые участники (обычно это я) часто указывают на то, что их методы не требуют предварительного и, следовательно, в большей степени «основаны на данных», чем «обусловлены суждениями». Конечно, байесовские указатели могут указывать на неинформативные приоры или, будучи прагматичными, просто использовать действительно размытый априор.

Мое беспокойство, особенно после того, как я почувствовал намек на самодовольство моей объективной объективности, заключается в том, что, возможно, мои якобы «объективные» методы могут быть сформулированы в байесовской структуре, хотя и с некоторой необычной априорной моделью и моделью данных. В таком случае, я просто блаженно не осведомлен о нелепой априорной модели, которую подразумевает мой метод частых исследований ?

Если бы байесовец указал на такую формулировку, я думаю, что моей первой реакцией было бы сказать: «Хорошо, хорошо, что вы можете это сделать, но я не думаю о проблеме!». Однако, кого волнует, как я об этом думаю , или как я это формулирую. Если моя процедура статистически / математически эквивалентна некоторой байесовской модели, то я неявно ( невольно !) Выполняю байесовский вывод.

Актуальный вопрос ниже

Эта реализация существенно подорвала любой соблазн быть самодовольным. Тем не менее, я не уверен, правда ли, что байесовская парадигма может приспособиться ко всем частым процедурам (опять же, при условии, что байесовский выбор выберет подходящую априорность и вероятность) . Я знаю , что обратное является ложным.

Я спрашиваю об этом, потому что недавно я опубликовал вопрос об условном выводе, который привел меня к следующей статье: здесь (см. 3.9.5,3.9.6)

Они указывают на известный результат Басу о том, что может быть более одной вспомогательной статистики, и возникает вопрос о том, какое «соответствующее подмножество» является наиболее релевантным. Хуже того, они показывают два примера того, где, даже если у вас есть уникальная вспомогательная статистика, она не устраняет присутствие других соответствующих подмножеств.

Они продолжают делать вывод, что только байесовские методы (или эквивалентные им методы) могут избежать этой проблемы, допуская условный вывод без проблем.

Может быть, дело не в том, что Байесовская статистика Fequentist Stats - это мой вопрос к этой группе здесь. Но похоже, что фундаментальный выбор между двумя парадигмами лежит не столько в философии, сколько в философии: нужна ли вам высокая условная точность или низкая безусловная ошибка: $\supset$

Высокая условная точность кажется применимой, когда мы должны проанализировать отдельный экземпляр - мы хотим быть правы для ЭТОГО конкретного вывода, несмотря на тот факт, что этот метод может быть неуместным или точным для следующего набора данных (гиперусловие / специализация).
Низкая безусловная ошибка уместна, если в некоторых случаях мы хотим сделать условно неправильные выводы, если наша долгосрочная ошибка минимизирована или контролируется. Честно говоря, после написания этого я не уверен, почему я хотел бы этого, если бы я не был ограничен во времени и не мог сделать байесовский анализ ... хммм.

Я склоняюсь к тому, чтобы основанный на правдоподобии вывод из числа фаринистов, так как я получаю некоторую (асимптотическую / приближенную) обусловленность от функции правдоподобия, но мне не нужно возиться с предварительным - однако мне становится все более комфортно с байесовским выводом, особенно если Я вижу предшествующий термин регуляризации для вывода небольшой выборки.

Извините за сторону. Любая помощь для моей главной проблемы приветствуется.

редактирование поста, похоже, испортило ссылку, но мне не хватает информации, чтобы исправить это.

— Дикран Сумчатый

@DikranMarsupial спасибо, что заметили это. Я добавил обратно в ссылку.

Ответы:

Я бы сказал, что частые люди действительно часто являются «неявными / невольными байесовцами», поскольку на практике мы часто хотим проводить вероятностные рассуждения о вещах, которые не имеют долгосрочной частоты. Классическим примером является статистическое тестирование нулевой гипотезы (NHST), где мы действительно хотим знать, что относительные вероятности гипотез Null и Research верны, но мы не можем сделать это в условиях частой практики, так как истинность конкретной гипотезы не имеет (нетривиальная) долгосрочная частота - это либо правда, либо нет. Частые НХСТ решают эту проблему, подставляя другой вопрос: «Какова вероятность наблюдения результата, по крайней мере, экстремального, при нулевой гипотезе», а затем сравнивают его с заранее установленным порогом. Однако эта процедура не логично позвольте нам сделать вывод о том, является ли H0 или H1 истинным, и при этом мы на самом деле выходим из частотного каркаса в (обычно субъективный) байесовский, где мы заключаем, что вероятность наблюдения такого экстремального значения при H0 равна настолько низко, что мы больше не можем верить, что H0, вероятно, будет правдой (обратите внимание, что это неявно присваивает вероятность определенной гипотезе).

$\alpha$ $p(H_0)$ $p(H_1)$

$\alpha$

Возможно, доверительные интервалы часто используются (и интерпретируются как) интервал, в котором мы можем ожидать наблюдения с заданной вероятностью, что опять-таки является байесовской интерпретацией.

В идеале статистики должны знать о преимуществах и недостатках обоих подходов и быть готовыми использовать подходящую основу для данного приложения. По сути, мы должны стремиться использовать анализ, который дает наиболее прямой ответ на вопрос, на который мы на самом деле хотим получить ответ (а не просто заменить его другим), поэтому частый подход, вероятно, наиболее эффективен, когда мы на самом деле заинтересованы в долгосрочных частотах и Байесовские методы, где это не так.

$H_0$

— Дикран Сумчатый
источник

p < 0.05

$p<0.05$

Я думаю, что это работает как критика статистики «нулевого ритуала», где НГСТ используются как рецепт из кулинарной книги статистики без размышления / понимания процедуры (вероятно, включая меня, когда я начинал; o).

— Дикран Сумчатый

Я думаю, что большая проблема с NHST - это не столько ритуализированный р <0,05, сколько то, что он искусственно ограничивает пространство гипотез. Я имею в виду, что они не рассматривают (в качестве гипотезы) многочисленные другие причины, по которым было бы темно, кроме как "взорвалось солнце". Это то, что мне действительно не нравится в NHST ... это настолько консервативно по отношению к нулю. Кроме того, мне интересно, какова будет сила этого теста?

H_{0}

$H_0$

@DikranMarsupial согласен! Фишер предполагал, что они будут помогать с сельскохозяйственными экспериментами, отсюда и значение p. Оценка пестицидов и удобрений - это не что иное, как оценка неразрешимых экзистенциальных вопросов ... неправильный инструмент для работы.

Байесовцы и частые люди отличаются не только тем, как они получают выводы, либо тем, насколько схожими или разными эти выводы могут быть неопределенными при некоторых предыдущих решениях. Основное различие заключается в том, как они интерпретируют вероятность:

Байесовская вероятность :

Байесовская вероятность является одной из интерпретаций концепции вероятности. В отличие от интерпретации вероятности как частоты или склонности к некоторому явлению, байесовская вероятность - это величина, которая назначается для представления состояния знаний или состояния убеждения.

Частота вероятности :

Частота вероятности или частота - стандартная интерпретация вероятности; он определяет вероятность события как предел его относительной частоты в большом количестве испытаний. Эта интерпретация поддерживает статистические потребности ученых-экспериментаторов и исследователей; вероятности могут быть найдены (в принципе) повторяющимся объективным процессом (и, таким образом, в идеале лишены мнения). Это не поддерживает все потребности; игроки обычно требуют оценки шансов без экспериментов.

Эти два определения представляют два несовместимых подхода к определению понятия вероятности (по крайней мере, пока). Таким образом, между этими двумя областями есть более фундаментальные различия, чем то, можете ли вы получить аналогичные оценки или одинаковые выводы в некоторых параметрических или непараметрических моделях.

— Pollo Anabolico
источник

Я не думаю, что они абсолютно непримиримы, длительная частота является вполне разумной основой для состояния знаний или убеждений.

— Дикран Сумчатый

@DikranMarsupial Это на самом деле открытая проблема в философии науки. Я понимаю вашу точку зрения, но примирение не так просто.

— Полло Анаболико,

f u n c t i o n a l l y

$functionally$

несомненно, частота была бы функционально эквивалентной, если бы для каждой байесовской процедуры был также аналог частиста, что не может быть правдой, поскольку байесовцы могут говорить о вероятностях для вещей без долгосрочных частот, а частые - нет.

— Дикран Сумчатый

@DikranMarsupial: да, поэтому я спросил, являются ли fequentist подмножеством байесовского (я признал, что обратное утверждение, как известно, неверно).