Байесовские и частые рассуждения на простом английском


341

Как бы вы описали на простом английском языке характеристики, которые отличают байесовские и частые рассуждения?


Этот вопрос о том, как сделать выводы об отдельном игроке в чашу, когда у вас есть два набора данных - результаты других игроков и результаты нового игрока, является хорошим спонтанным примером различия, которое мой ответ пытается объяснить простым языком.
Питер Эллис

4
Возможно, некоторые из вас, хорошие люди, могли бы также дать ответ на вопрос о байесовских и частых интерпретациях, который задают на сайте философии .stackexchange.com .
Друкс

Ответы:


198

Вот как я бы объяснил основную разницу моей бабушке:

Я потерял свой телефон где-то дома. Я могу использовать локатор телефона на основании инструмента, чтобы найти телефон, и когда я нажимаю локатор телефона, телефон начинает издавать звуковые сигналы.

Проблема: в каком районе моего дома я должен искать?

Частые рассуждения

Я слышу писк телефона. У меня также есть ментальная модель, которая помогает мне определить область, из которой исходит звук. Поэтому, услышав звуковой сигнал, я определяю область своего дома, которую я должен найти, чтобы найти телефон.

Байесовское рассуждение

Я слышу писк телефона. Теперь, кроме ментальной модели, которая помогает мне определить область, из которой исходит звук, я также знаю места, где в прошлом я помещал телефон не на место. Итак, я объединяю свои выводы, используя звуковые сигналы и мою предыдущую информацию о местах, в которых я потерял телефон в прошлом, чтобы определить область, которую я должен найти, чтобы найти телефон.


11
Мне нравится аналогия. Я был бы очень полезен, если бы существовал определенный вопрос (основанный на наборе данных), в котором ответ был получен с помощью частых рассуждений, а ответ был получен с использованием байесовского алгоритма - предпочтительно с использованием сценария R для обработки обоих рассуждений. Я слишком много спрашиваю?
Фаррел

15
Самая простая вещь, которую я могу придумать, это бросить монету n раз и оценить вероятность появления головы (обозначим через p). Предположим, мы наблюдаем k голов. Тогда вероятность получения k голов составляет: P (k голов в n испытаниях) = (n, k) p ^ k (1-p) ^ (nk) Вывод, сделанный частыми лицами, максимально увеличил бы вышеприведенное, чтобы получить оценку p = k / н. Байесов сказал бы: «Эй, я знаю, что p ~ Beta (1,1) (что эквивалентно предположению, что p равномерно на [0,1]). Таким образом, обновленный вывод будет: p ~ Beta (1 + k, 1 + nk), и, следовательно, байесовская оценка p будет p = 1 + k / (2 + n). Я не знаю R, извините.

41
Следует отметить, что, с точки frequentists зрения, нет никаких оснований , что вы не можете включить предшествующее знание в модели. В этом смысле представление «частых» проще: у вас есть только модель и некоторые данные. Нет необходимости отделять предшествующую информацию от модели.
Робби МакКиллиам

1
@ user28 В качестве комментария к вашему комментарию, если , то частый пользователь оценит (соответственно ), увидев результат голов (соответственно головы), т. е. монета двуглавый или двусторонний. Байесовские оценки и соответственно допускают возможность того, что это несколько менее предвзятая монета. р = 0 р = 1 к = 0 к = 3 1 / 5 4 / 5n=3p=0p=1k=0k=31/54/5
Дилип Сарват

3
@ BYS2 Язык программирования называется R.
user1205901

104

Язык крепко в щеку:

Байесовский определяет «вероятность» точно так же, как это делает большинство не статистиков, а именно - указание на правдоподобие предложения или ситуации. Если вы зададите ему вопрос, он даст вам прямой ответ с указанием вероятностей, описывающих вероятности возможных результатов для конкретной ситуации (и изложит свои предыдущие предположения).

Частый человек - это тот, кто полагает, что вероятности представляют долгосрочные частоты, с которыми происходят события; если потребуется, он придумает фиктивную популяцию, из которой ваша конкретная ситуация может рассматриваться как случайная выборка, чтобы он мог осмысленно говорить о долгосрочных частотах. Если вы зададите ему вопрос о конкретной ситуации, он не даст прямого ответа, а вместо этого сделает заявление об этом (возможно, воображаемом) населении. Многие нечастые статистики будут легко смущены ответом и будут интерпретировать его как байесовскую вероятность конкретной ситуации.

Тем не менее, важно отметить, что большинство методов Frequentist имеют байесовский эквивалент, который в большинстве случаев даст по существу тот же результат, разница в значительной степени зависит от философии, а на практике это вопрос «лошадей на курсах».

Как вы уже догадались, я байесовец и инженер. ; О)


36
Как не эксперт, я думаю, что ключ ко всем дебатам в том, что люди на самом деле рассуждают как байесовцы. Вы должны быть обучены думать, как частый человек, и даже тогда легко упасть и либо рассуждать, либо представлять свои рассуждения, как если бы они были байесовскими. «Существует 95% вероятность того, что значение находится в пределах этого доверительного интервала». Достаточно сказано.
Уэйн

8
Ключ также состоит в том, чтобы подумать о том, какой вид лоббирования можно назвать статистикой 20-го века "классической", в то время как статистические данные, которые Лаплас и Гаусс начали использовать в 19-м веке, не ...
gwr

3
Возможно, я слишком часто занимался частыми работами, но я не уверен, что байесовская точка зрения всегда интуитивна. Например, предположим, что меня интересует реальный интересующий параметр, такой как средний рост населения. Если я скажу вам «с вероятностью 95% интересующий параметр в моем вероятном интервале», а затем задайте вопрос: «Если бы мы создали 100 таких интервалов для разных параметров, какую долю из них мы ожидали бы содержать? Реальные значения параметра? », тот факт, что ответ не 95, должно вводить некоторых людей в заблуждение.
Клифф А.Б.

4
@CliffAB, но почему вы задаете второй вопрос? Дело в том, что это разные вопросы, поэтому неудивительно, что у них разные ответы. Байсиан может ответить на оба вопроса, но ответ может быть разным (что мне кажется разумным). Частик может ответить только на один из вопросов (из-за ограничительного определения вероятности) и, следовательно, (неявно) использует один и тот же ответ на оба вопроса, что и вызывает проблемы. Достоверный интервал не является доверительным интервалом, но байесовский может построить как достоверный интервал, так и доверительный интервал.
Дикран Marsupial

4
Мой комментарий был в ответ на комментарии Уэйна; идея, что люди «естественно» думают в байесовском контексте, поскольку легче интерпретировать достоверный интервал. Моя точка зрения заключается в том, что, хотя проще построить правильную интерпретацию достоверного интервала (т. Е. Меньше словарного супа), я думаю, что не статистик с такой же вероятностью будет смущен тем, что это действительно означает.
Клифф А.Б.

64

Очень грубо я бы сказал, что:

Frequentist: Выборка бесконечна, и правила принятия решений могут быть точными. Данные представляют собой воспроизводимую случайную выборку - есть частота. Базовые параметры являются фиксированными, то есть они остаются постоянными в течение этого повторяемого процесса отбора проб.

Байесовский: неизвестные количества рассматриваются вероятностно, и состояние мира всегда может быть обновлено. Данные наблюдаются из реализованного образца. Параметры неизвестны и описаны вероятностно. Это данные, которые являются фиксированными.

Есть замечательное сообщение в блоге, в котором приведен яркий пример того, как байесовский и частый исследователи будут решать одну и ту же проблему. Почему бы не ответить на проблему для себя, а затем проверить?

Проблема (взято из блога Panos Ipeirotis):

У вас есть монета, которая при подбрасывании заканчивается головой с вероятностью p и заканчивается хвостом с вероятностью 1-p. (Значение p неизвестно.)

Пытаясь оценить p, вы подбрасываете монету 100 раз. Это заканчивается головой 71 раз.

Затем вам нужно определиться со следующим событием: «В следующих двух бросках мы получим две головы подряд».

Могли бы вы поспорить, что событие произойдет или не произойдет?


6
Поскольку , я бы это достаточно близким к четной ставке, чтобы быть готовым пойти скромно в любую сторону просто для удовольствия (и игнорировать любые проблемы, связанные с формой предыдущего). Я иногда покупаю страховые и лотерейные билеты с гораздо худшими шансами. 0.712=0.5041
Генри

5
В конце этого сообщения в блоге говорится: «вместо того, чтобы использовать равномерное распределение в качестве предыдущего, мы можем быть еще более независимыми. В этом случае мы можем использовать бета-версию (0,0) в качестве предварительного. Такое распределение соответствует к случаю, когда любое среднее значение распределения одинаково вероятно. В этом случае два подхода, байесовский и частый, дают одинаковые результаты ». какой тип суммирует это на самом деле!
TDC

13
Большая проблема с этим сообщением в блоге это не адекватно характеризует то , что небайезианский (но рационально) , принимающее решение будет делать. Это немного больше, чем соломенный мужчина.
whuber

1
@tdc: Байесовский (Джеффрис) предшествующий - бета (0,5, 0,5), и некоторые скажут, что это единственный оправданный предшествующий уровень.
Нил Г

1
@mcb - точно.
дигиттер

42

Допустим, человек бросает шестигранный кубик, и у него есть результаты 1, 2, 3, 4, 5 или 6. Кроме того, он говорит, что если он выпадет на 3, он даст вам бесплатный учебник.

Тогда неофициально:

Частотный бы сказать , что каждый результат имеет равный 1 в 6 шанс возникновения. Она рассматривает вероятность как полученную из долгосрочных частотных распределений.

Байесовское однако сказал бы повесить на секунду, я знаю , что человек, он Дэвид Блейн, известный обманщик! У меня ощущение, что он что-то замышляет. Я собираюсь сказать, что вероятность того, что он попадет на 3 НО, составляет всего 1%. Я буду переоценивать этого верующего и менять его по мере того, как он бросает кубик. Если я увижу, что другие числа появляются одинаково часто, то я итеративно увеличу шанс с 1% до чего-то немного более высокого, иначе я уменьшу его еще больше. Она рассматривает вероятность как степень веры в суждение.


24
Я думаю, что частый участник (многословно) укажет на свои предположения и не сделает каких-либо полезных прогнозов. Возможно, он сказал бы: «Если предположить, что кубик справедлив, у каждого результата есть равный шанс 1 к 6. Более того, если броски кубика справедливы, а Дэвид Блейн бросает кубик 17 раз, есть только 5% шанс, что он никогда не приземлится на 3, поэтому такой исход заставит меня усомниться в том, что умирание справедливо ».
Томас Левин

Таким образом, "вероятность" (как в MLE) будет "вероятностью" частого человека?
Акабаба

40

Просто немного веселья ...

Байесовец - это тот, кто, смутно ожидая коня и мельком увидев осла, твердо верит, что видел мула.

С этого сайта:

http://www2.isye.gatech.edu/~brani/isyebayes/jokes.html

и с того же сайта, хорошее эссе ...

«Интуитивное объяснение теоремы Байеса»

http://yudkowsky.net/rational/bayes


14
В этом случае частым участником будет не тот, кто знает соотношение популяций ослов, мулов и лошадей, и, наблюдая стаю мулов, начинает вычислять значение p, чтобы узнать, произошло ли статистически значимое увеличение в популяции соотношение мулов.
Андрей

30

Байесовца просят делать ставки, которые могут включать в себя все, от чего муха будет ползти по стене быстрее, на какое лекарство спасет большинство жизней или какие заключенные должны отправиться в тюрьму. У него большая коробка с ручкой. Он знает, что если он положит в коробку абсолютно все, что он знает, включая его личное мнение, и повернет ручку, это примет для него наилучшее возможное решение.

Часто просят написать отчеты. У него большая черная книга правил. Если ситуация, о которой его просят сделать отчет, покрыта его книгой правил, он может следовать правилам и написать отчет настолько тщательно, что он ошибочен, в худшем случае, один раз из 100 (или один раз из 20, или один время, как указано в спецификации для его доклада).

Частый участник знает (потому что он написал отчеты об этом), что байесовский игрок иногда делает ставки, которые в худшем случае, когда его личное мнение ошибочно, могут оказаться плохими. Частый участник также знает (по той же причине), что если он будет делать ставку на байесовский каждый раз, когда он отличается от него, то в долгосрочной перспективе он проиграет.


«в долгосрочной перспективе он проиграет» неоднозначно. Я предполагаю, что он здесь байесовский? Разве они не сравнялись бы в долгосрочной перспективе - байесовец мог выучить и изменить свое личное мнение, пока оно не совпадет с фактическими (но неизвестными) фактами.
lucidbrot

26

Говоря простым языком, я бы сказал, что байесовские и частые рассуждения различаются двумя разными способами ответа на вопрос:

Какова вероятность?

Большинство различий по существу сводятся к тому, как каждый отвечает на этот вопрос, поскольку он в основном определяет область допустимых применений теории. Теперь вы не можете дать ни одного ответа в терминах «простого английского», не задавая больше вопросов. Для меня ответ (как вы могли догадаться)

вероятность это логика

моя «непростая английская» причина этого заключается в том, что исчисление высказываний является частным случаем исчисления вероятностей, если мы представляем истину в и ложь в0 110, Кроме того, исчисление вероятностей может быть получено из исчисления предложений. Это наиболее близко согласуется с «байесовским» рассуждением - хотя оно также расширяет байесовское рассуждение в приложениях, предоставляя принципы для распределения вероятностей в дополнение к принципам управления ими. Конечно, это приводит к последующему вопросу "что такое логика?" для меня самое близкое, что я мог бы дать в качестве ответа на этот вопрос: «логика - это здравый смысл суждений рационального человека с заданным набором предположений» (что такое рациональный человек? и т. д. и т. д.). Логика имеет те же особенности, что и байесовские рассуждения. Например, логика не говорит вам, что предполагать или что является «абсолютно верным». Это только говорит вам, как правда одного предложения связана с правдой другого. Вы всегда должны снабжать логическую систему «аксиомами», чтобы начать делать выводы. Они также имеют те же ограничения в том, что вы можете получить произвольные результаты из противоречивых аксиом. Но «аксиомы» - это не что иное, как априорные вероятности, которые были установлены1 . Для меня отвергнуть байесовские рассуждения - значит отказаться от логики. Если вы принимаете логику, то, поскольку байесовские рассуждения «логически вытекают из логики» (как это для простого английского языка: P), вы также должны принять байесовские рассуждения.

Для частых рассуждений у нас есть ответ:

вероятность есть частота

хотя я не уверен, что «частота» - это простой английский термин в том смысле, как он здесь используется - возможно, «пропорция» - более подходящее слово. Я хотел добавить в ответ на частый ответ, что вероятность события считается реальной, измеримой (наблюдаемой?) Величиной, которая существует независимо от человека / объекта, который ее вычисляет. Но я не мог сделать это «простым английским» способом.

Так что, возможно, в «простой английской» версии одно из различий может заключаться в том, что частые рассуждения - это попытка рассуждения из «абсолютных» вероятностей, тогда как байесовские рассуждения - это попытка рассуждения из «относительных» вероятностей.

Другое отличие состоит в том, что основополагающие принципы более расплывчаты в том, как вы переводите проблему реального мира в абстрактную математику теории. Хорошим примером является использование «случайных величин» в теории - они имеют точное определение в абстрактном мире математики, но нет однозначной процедуры, которую можно использовать, чтобы решить, является ли некоторая наблюдаемая величина «случайной» или нет. переменная».

Байесовский способ рассуждения, понятие «случайная величина» не является необходимым. Распределение вероятностей присваивается количеству, потому что оно неизвестно - это означает, что оно не может быть логически выведено из имеющейся у нас информации. Это сразу обеспечивает простую связь между наблюдаемой величиной и теорией, поскольку «быть неизвестным» однозначно.

В приведенном выше примере вы также можете увидеть еще одно отличие этих двух способов мышления - «случайный» и «неизвестный». «случайность» сформулирована таким образом, что «случайность» выглядит так, как будто она является свойством действительной величины. И наоборот, «быть неизвестным» зависит от того, какого человека вы спрашиваете об этом количестве - следовательно, это свойство статистика, проводящего анализ. Это приводит к появлению «объективных» и «субъективных» прилагательных, часто приписываемых каждой теории. Легко показать, что «случайность» не может быть свойством некоторых стандартных примеров, просто попросив двух часто встречающихся, которым дают разную информацию об одном и том же количестве, решить, является ли оно «случайным». Одним из них является обычная урна Бернулли: частый 1 завязывает глаза во время рисования, в то время как частый 2 стоит над урной, наблюдая, как частый 1 вытягивает шары из урны. Если объявление «случайности» является свойством шаров в урне, то оно не может зависеть от разного знания участников 1 и 2 - и, следовательно, два участника должны давать одно и то же объявление «случайный» или «не случайный» ,


3
Мне было бы интересно, если бы вы могли переписать это без ссылки на здравый смысл.
Питер Эллис

@PeterEllis - Что не так со здравым смыслом? У всех нас это есть, и, как правило, глупо не использовать его ...
вероятностное

13
Это слишком доказанное , что это на самом деле, и слишком культурная специфика. «Здравый смысл» - это короткая рука для того, что воспринимается разумным способом ведения дел в этой конкретной культуре (которая слишком часто выглядит далекой от разумной для другой культуры во времени и пространстве), поэтому обращение к нему в определении уклоняется от ключевых вопросов. , Это особенно бесполезно как часть определения логики (и, я бы сказал, концепция «рационального человека» в данном конкретном контексте - особенно, поскольку я предполагаю, что ваше определение «рационального человека» было бы логичным человеком) у кого есть здравый смысл!)
Питер Эллис

4
Он не может предоставить один, его аргумент в том, что не существует универсального определения , только культурно-специфические. Два человека из разных культур (включая разные стили статистического образования) вполне могут иметь два разных понимания того, что разумно делать в данных ситуациях.
naught101

2
В этом ответе есть кусочки добра (как это для простого английского?), Но я не верю (как это для того, чтобы быть байесовским!), Что следующее утверждение верно: «Ибо, если вы принимаете логику ... вы также должны принять Байесовские рассуждения ». Например, если вы думаете, вместо того, чтобы переводить абстрактную теорию математики в реальный мир, вы обнаружите, что аксиоматический подход может быть согласован как с частыми, так и с байесовскими рассуждениями! Возможно, Колмогоров в первом случае, а, скажем, Джеффрис во втором. По сути, это теория вероятности, это логика; не его интерпретация.
Грэм Уолш

21

На самом деле, я думаю, что большая часть философии, связанной с этой проблемой, является просто выдающейся. Это не для того, чтобы отклонить дебаты, но это слово предостережения. Иногда практические вопросы имеют приоритет - я приведу пример ниже.

Кроме того, вы также можете легко утверждать, что существует более двух подходов:

  • Нейман-Пирсон («частый человек»)
  • Подходы, основанные на вероятности
  • Полностью байесовский

Старший коллега недавно напомнил мне, что «многие люди на общем языке говорят о частоте и байесовском. Я думаю, что более обоснованное различие основано на вероятностном подходе и частом. Как метод максимального правдоподобия, так и байесовский метод придерживаются принципа правдоподобия, в то время как методы частого использования этого не делают. "

Я начну с очень простого практического примера:

У нас есть пациент. Пациент либо здоров (H), либо болен (S). Мы проведем тест на пациенте, и результат будет положительным (+) или отрицательным (-). Если пациент болен, он всегда получит положительный результат. Мы назовем это правильным (C) результатом и скажем, что или Если пациент здоров, тест будет отрицательным в 95% случаев, но при этом будут некоторые ложные срабатывания. В других работах вероятность правильности теста для здоровых людей составляет 95%.P ( C o r r e c t | S ) = 1 P ( - | H ) = 0,95 P ( + | H ) = 0,05

P(+|S)=1
P(Correct|S)=1
P(|H)=0.95
P(+|H)=0.05

Таким образом, тест либо на 100%, либо на 95%, в зависимости от того, здоров пациент или болен. В совокупности это означает, что тест с точностью не менее 95%.

Все идет нормально. Это заявления, которые будут сделаны частыми лицами. Эти утверждения довольно просты для понимания и являются правдой. Нет необходимости болтать о «частой интерпретации».

Но все становится интересным, когда вы пытаетесь все изменить. Учитывая результаты теста, что вы можете узнать о здоровье пациента? Учитывая отрицательный результат теста, пациент, очевидно, здоров, поскольку нет ложных отрицательных результатов.

Но мы также должны рассмотреть случай, когда тест положительный. Был ли тест положительным, потому что пациент был действительно болен, или это был ложный положительный результат? Это где частое и байесовское расхождение. Все согласятся, что на это нельзя ответить в данный момент. Частик откажется отвечать. Байесовец будет готов дать вам ответ, но вы должны будете заранее дать Байесову - то есть сказать, какая часть пациентов больна.

Напомним, что следующие утверждения верны:

  • Для здоровых пациентов тест очень точный.
  • Для больных пациентов тест очень точный.

Если вас устраивают такие заявления, то вы используете частые интерпретации. Это может измениться от проекта к проекту, в зависимости от того, какие проблемы вы смотрите.

Но вы можете сделать разные заявления и ответить на следующий вопрос:

  • Насколько точен этот тест для тех пациентов, которые получили положительный результат теста?

Это требует предварительного и байесовского подхода. Отметим также, что это единственный вопрос, интересующий врача. Врач скажет: «Я знаю, что пациенты получат либо положительный результат, либо отрицательный результат. Я также теперь, когда отрицательный результат означает, что пациент здоров и его можно отправить домой. Единственные пациенты, которые меня сейчас интересуют, это те, кто получил положительный результат - они больны?

Подводя итог: в таких примерах байесовский согласен со всем, что говорит частый участник. Но Байесовский будет утверждать, что заявления частых, хотя и верны, не очень полезны; и будет утверждать, что на полезные вопросы можно ответить только с предварительным.

Участник часто рассматривает каждое возможное значение параметра (H или S) и спрашивает: «Если параметр равен этому значению, какова вероятность того, что мой тест будет правильным?»

Вместо этого байесовец по очереди рассмотрит каждое возможное наблюдаемое значение (+ или -) и спросит: «Если я представлю, что только что наблюдал это значение, что это говорит мне об условной вероятности H-против-S?»


1
Вы имеете в виду, что For sick patients, the test is NOT very accurate.вы забыли НЕ?
agstudy

1
Это очень точно в обоих случаях, поэтому нет, я не забыл ни слова. Для здоровых людей результат будет правильным (то есть «отрицательный») в 95% случаев. А для больных людей результат будет правильным (то есть «положительным») в 95% случаев.
Аарон МакДейд

Я думаю, что «слабость» в максимальной вероятности заключается в том, что она предполагает единообразный априорный анализ данных, тогда как «полный байесовский» более гибок в выборе априорных данных.
Джо З.

Чтобы завершить пример, предположим, что 0,1% населения болеют болезнью D, которую мы проверяем: это не наш предварительный тест. Более вероятно, что примерно у 30% пациентов, которые приходят к врачу и имеют симптомы, совпадающие с D, на самом деле есть D (это может быть более или менее в зависимости от таких деталей, как, например, частота различных заболеваний с одинаковыми симптомами). Таким образом, 70% из тех, кто проходит тест, здоровы, 66,5% получают отрицательный результат, а 30% / 33,5% больны. Таким образом, учитывая положительный результат, наша последующая вероятность того, что пациент болен, составляет 89,6%. Следующая загадка: откуда мы узнали, что у 70% тестируемых есть D?
Qwertie

7

Байесовские и частые статистические данные совместимы в том смысле, что их можно понимать как два ограничивающих случая оценки вероятности будущих событий на основе прошлых событий и предполагаемой модели, если допустить, что в пределе очень большого числа наблюдений нет неопределенности в отношении система остается, и что в этом смысле очень большое количество наблюдений равнозначно знанию параметров модели.

Предположим, мы сделали некоторые наблюдения, например, результат 10 бросков монет. В байесовской статистике вы начинаете с того, что вы наблюдали, а затем вы оцениваете вероятность будущих наблюдений или параметров модели. В статистике часто вы начинаете с идеи (гипотезы) о том, что является правдой, предполагая, что были сделаны сценарии большого количества наблюдений, например, монета беспристрастна и дает 50% -ое преимущество, если вы бросаете ее много раз. Основываясь на этих сценариях большого количества наблюдений (= гипотезы), вы оцениваете частоту проведения наблюдений, аналогичную той, которую вы делали, т. Е. Частоту различных результатов 10 бросков монет. Только тогда вы берете свой фактический результат, сравниваете его с частотой возможных результатов и решаете, относится ли этот результат к тем, которые ожидаются с высокой частотой. Если это так, вы заключаете, что проведенное наблюдение не противоречит вашим сценариям (= гипотеза). В противном случае вы придете к выводу, что проведенное наблюдение несовместимо с вашими сценариями, и отклоните гипотезу.

Таким образом, байесовская статистика начинается с того, что наблюдалось, и оценивает возможные будущие результаты. Статистика для начинающих начинается с абстрактного эксперимента о том, что будет наблюдаться, если предположить что-либо, и только затем сравнивает результаты абстрактного эксперимента с тем, что действительно наблюдалось. В противном случае оба подхода совместимы. Они оба оценивают вероятность будущих наблюдений на основе некоторых наблюдений, сделанных или предположенных.

Я начал писать это более формально:

Позиционирование байесовского умозаключения как особого применения частичного умозаключения и наоборот. figshare.

http://dx.doi.org/10.6084/m9.figshare.867707

Рукопись новая. Если вам довелось прочитать его и оставить комментарии, пожалуйста, дайте мне знать.


6

Я бы сказал, что они смотрят на вероятность по-разному. Байесовский субъективен и использует априорные убеждения для определения априорного распределения вероятностей возможных значений неизвестных параметров. Поэтому он опирается на теорию вероятностей, подобную теории деФинетти. Частотник рассматривает вероятность как нечто, имеющее отношение к предельной частоте, основанной на наблюдаемой пропорции. Это соответствует теории вероятностей, разработанной Колмогоровым и Мизесом.
Частик делает параметрический вывод, используя только функцию правдоподобия. Байесовец берет это и умножает на априор и нормализует его, чтобы получить апостериорное распределение, которое он использует для вывода.


4
+1 Хороший ответ, но следует подчеркнуть, что байесовский подход и частотный подход различаются в отношении их интерпретации вероятности. Колмогоров, с другой стороны, обеспечивает аксиоматическое обоснование теории вероятности, которая не требует интерпретации (!), Подобной тем, которые используются байесовским или частотным исследователем. В некотором смысле, аксиоматическая система имеет собственную жизнь! Только из шести аксиом Колмогорова я не думаю, что можно сказать, что его аксиоматическая система является либо байесовской, либо частотной, и, на самом деле, может соответствовать обеим.
Грэм Уолш

1

То, как я отвечаю на этот вопрос, состоит в том, что частые сравнивают данные, которые они видят, с тем, что они ожидали. То есть у них есть ментальная модель того, как часто что-то должно происходить, а затем просматривать данные и как часто это происходило. то есть, насколько вероятны данные, которые они увидели, с учетом выбранной ими модели.

Байесовцы , с другой стороны, объединяют свои ментальные модели. То есть у них есть модель, основанная на их предыдущем опыте, которая говорит им, как, по их мнению, должны выглядеть данные, а затем они комбинируют это с данными, которые наблюдают, чтобы обосновать какое-то « последующее» убеждение. то есть они находят вероятность того, что модель, которую они стремятся выбрать, действительна, учитывая данные, которые они наблюдали.


-2

Frequentist: истинное состояние природы. Если я обычно делаю такие анализы, 95% моих ответов будут правильными.

Байесиан: Есть 95% вероятности, что истинный ответ ... Я основываю это на комбинации данных, которые вы мне дали, и наших предыдущих предположений о том, что такое истина.


-3

Частые: ставки на кости. Результат будет зависеть только от значения кубика: вы выиграете свою ставку или нет. В зависимости от одного случая.

Байесовский: игра в Техасский Холдем. Вы единственный, кто видит ваши две карты. У вас есть некоторые знания о других игроках на столе. Вы должны отрегулировать свою вероятность выиграть на флопе, терне и ривере и, возможно, в зависимости от того, какие игроки остались. Они часто блефуют? Они агрессивные или пассивные игроки? Все это решит, что вы будете делать. Не только вероятность того, что вы получили первые две карты, зависит, выиграете вы или нет.

Играть в частый покер означало бы, что каждый игрок сначала показывает свои руки, а затем делает ставку или сбрасывает карты до флопа, терна и ривера. Теперь снова зависит только от случая, выиграешь ты или нет.


-5

Скажем, если у вас болит голова и идете к врачу. Предположим, что в наборе решений доктора есть две причины головной боли: № 1 для опухоли головного мозга (основная причина, которая вызывает головную боль в 99% случаев), и № 2 для простуды (причина, которая может вызвать головные боли у очень немногих пациентов) ,

Тогда решения врачей, основанные на подходе Frequentist, будут: у вас опухоль мозга.

Решение врачей, основанное на байесовском подходе, скажет вам, что вы простудились (даже если только 1% простуд вызывает головные боли)


1
(-1) Неясно, в чем разница между «Frequentist doc» и «Bayesian doc». Я не вижу причин, по которым Доку Frequentist можно было бы игнорировать данные о головной боли, вызывающей простуду Байесовский доктор, похоже, не использует теорему Байеса или приоры, так что я не понимаю, как он Байесовский?
Тим

Слишком неправдоподобно, чтобы быть полезной или даже занимательной аналогией.
Ник Кокс

-6

Кобеля и кошку помещают в стальную камеру вместе с едой и водой на 70 дней.

Частый участник сказал бы, что средний период беременности для кошек составляет 66 дней, самка была в жару, когда кошки были подкоплены, и однажды в жару она будет повторно спариваться в течение 4-7 дней. Поскольку, вероятно, было много случаев размножения и достаточного количества времени для беременности, вероятность того, что когда коробка открыта на 70-й день, появляется помет новорожденных котят.

Байесовец сказал бы, я слышал, как какой-то серьезный Марвин Гэй выходил из коробки в первый день, а затем этим утром я услышал много похожих на котят звуков, исходящих из коробки. Так что, не зная ничего о размножении кошек, вероятнее всего, когда коробка открывается на 70-й день, появляется помет новорожденных котят.


То, как я это написал, в частности, из-за того, что байесианец не очень много знал о размножении кошек, поначалу только частый игрок делал ставку на котят. Важным моментом моего очень грубого примера было то, что частый человек сделал свой прогноз на основе данных в начале, затем откинулся назад, не добавляя новых дополнительных данных, в то время как байесовский метод не имел большого количества данных для начала, но продолжал включать соответствующие данные по мере их поступления.
Лев

3
... и почему небайесовцы тоже не воспользуются дополнительными данными?
whuber
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.