Модифицированная теорема Байеса в XKCD: на самом деле довольно разумно?


81

Я знаю, что это комикс, известный тем, что он использует определенные аналитические тенденции , но на самом деле он выглядит довольно разумным после нескольких минут просмотра. Кто-нибудь может рассказать мне, что делает эта « модифицированная теорема Байеса »?


4
объяснение объяснения от автора объясняет объяснение xkcd.com/wiki/index.php/2059:_Modified_Bayes%27_Theorem .
Чаллака

50
@ Tschallacka С чего ты взял, что Рэндалл написал это?
Касперд

16
@ Tschallacka, если ни один из авторов не является самим Рэндаллом, это не тот случай.
SQB

Но не следует ли применить теорему Байеса к P (C), чтобы обновить ее значение перед лицом новых доказательств?
Якк

1
Я почти уверен, что есть просто шутливое дополнение. P(C)
Ян Макдональд

Ответы:


107

Хорошо, распределяя член , мы получаем который мы можем интерпретировать как закон полной вероятности, примененный к событию «вы правильно используете байесовскую статистику». Так что если вы используете байесовскую статистику правильно, то восстановить закон Байеса (левая фракцию выше) , и если у вас нет, то вы игнорируете данные , и просто использовать ваш перед на .P(H)

P(H|X)=P(X|H)P(H)P(X)P(C)+P(H)[1P(C)],
C=H

Я полагаю, что это возражение против критики, согласно которой в принципе байесовцы могут скорректировать предварительную оценку, чтобы поддержать любой вывод, который они хотят, в то время как байесовцы утверждают, что это не то, как на самом деле работает байесовская статистика.

(И да, вы успешно обстреляли меня изо всех сил . Я не математик и не физик, поэтому я не уверен, сколько очков я стою.)


60
Умная шутка, которая встроена в формулу выше, состоит в том, что, если вы не используете байесовскую статистику правильно, ваш вывод полностью независим от правды.
Клифф AB

25
Я надеюсь, что вы не напечатали свой ответ при переходе оживленной улицы. Я не буду участвовать в этом ...
eric_kernfeld

6
Вид байесов, изображенных выше, не является байесовскими статистиками, это байесовские юристы
kjetil b halvorsen

4
@CliffAB Я не знаю, назову ли я это умной шуткой или законом природы.
eric_kernfeld

7
@CLiffAB Вы имеете в виду «Ваш апостериорный (рассчитанный по этой формуле) не зависит от доказательств»?
накопление

31

Хотите верьте, хотите нет, но этот тип модели время от времени появляется в очень серьезных статистических моделях, особенно когда речь идет о слиянии данных, т.е. при попытке объединить вывод из нескольких датчиков, пытаясь сделать вывод об одном событии.

Если датчик неисправен, он может сильно повлиять на выводы, сделанные при попытке объединить сигналы от нескольких источников. Вы можете сделать модель более устойчивой к этой проблеме, включив небольшую вероятность того, что датчик просто передает случайные значения, независимо от фактического интересующего события. Это приводит к тому, что, если 90 датчиков слабо указывают, что истинно, а 1 датчик строго указывает, что истинно, мы все равно должны заключить, чтоABAистинно (т. е. последующая вероятность того, что этот сенсор пропал один раз, становится очень высокой, когда мы понимаем, что он противоречит всем остальным сенсорам). Если распределение отказов не зависит от параметра, на который мы хотим сделать вывод, то, если апостериорная вероятность того, что это отказ, высока, измерения от этого датчика очень мало влияют на апостериорное распределение для интересующего параметра; фактически независимость, если задняя вероятность отказа равна 1.

Является ли это общей моделью, которую следует учитывать, когда речь заходит о выводе, т. Е. Следует ли заменять теорему Байеса модифицированной теоремой Байеса при выполнении байесовской статистики? Нет. Причина в том, что «правильное использование байесовской статистики» на самом деле не просто двоичное (или, если оно есть, всегда ложное). Любой анализ будет иметь степень неправильных предположений. Чтобы ваши выводы были полностью независимы от данных (что подразумевается под формулой), вам необходимо сделать чрезвычайно серьезные ошибки. Если «неправильное использование байесовской статистики» на любом уровне означает, что ваш анализ полностью независим от правды, использование статистики будет совершенно бесполезным. Все модели ошибочны, но некоторые полезны и все такое.


5
Я полагаю, нам повезло, обнаружив, что режим статического сбоя наших датчиков является одним или другим. Шумоподавление намного сложнее, хотя. Действительно раздражает обнаружение, что датчик работает правильно, а полученное значение неверно, потому что провод действует как антенна.
Джошуа

@ Джошуа, надеюсь, когда-нибудь у меня будет время, чтобы должным образом освоить фильтрацию Калмана для подобных ситуаций (или, может быть, кто-то напишет блестящий ответ SE, который все прояснит?).
mbrig

@Joshua: я думаю, что вы думаете о гораздо более конкретной модели, чем я. Хотя хорошая характеристика распределения отказов может улучшить вывод, они все же могут быть очень полезны в случае очень расплывчатых распределений отказов. Например, предположим, что мы хотели сделать вывод о параметре а датчик, который измеряю, равен если он работает. Мы могли бы включить небольшую вероятность того, что это, скажем, в случае отказа. Если датчик сильно не согласен со всеми другими датчиками, последующая вероятность того, что это отказ, становится очень высокой. μiN(aiμ,1)t(df=10)i
Клифф А.Б.
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.