Теорема Байеса Интуиция


22

Я пытался развить интуитивное понимание теоремы Байеса с точки зрения априорной , апостериорной , вероятностной и предельной вероятности. Для этого я использую следующее уравнение: где представляет гипотезу или убеждение, а представляет данные или свидетельство. Я понял концепцию апостериор - это объединяющая сущность, которая сочетает в себе предшествующее убеждение и вероятность события. То, что я не понимаю, что означает вероятность ? И почему маргинальный AB

P(B|A)=P(A|B)P(B)P(A)
AB
вероятность в знаменателе?
Изучив пару ресурсов, я наткнулся на эту цитату:

Вероятность является вес события B определяется возникновением A ... P(B|A) является задней вероятностью события B , при условии , что событие произошло.A

Вышеприведенные 2 утверждения кажутся мне идентичными, просто написаны по-разному. Может кто-нибудь объяснить, пожалуйста, разницу между ними?


4
У вас есть опечатка (или заблуждение). B должен быть «гипотезой или верой», а A должен быть «данными или доказательством» в вашей формулировке.
gung - Восстановить Монику

1
см. мой ответ на math.stackexchange.com/a/1943255/1505 , вот как я понял это интуитивно
Линдон Уайт

Ответы:


27

Хотя в законе Байеса перечислены четыре компонента, я предпочитаю думать в терминах трех концептуальных компонентов:

P(B|A)2=P(A|B)P(A)3P(B)1
  1. До является то , что вы думали о , прежде встретив новую и соответствующую часть информации (то есть, ). AB A
  2. Задний является то , что вы верите (или должен, если вы рациональны) о после встретив новую и соответствующую часть информации. B
  3. Фактор вероятности , разделенный на предельной вероятности новой информации индексов информативности новой информации для ваших представлений о . B

19

Уже есть несколько хороших ответов, но, возможно, это может добавить что-то новое ...

Я всегда думаю о байесовском правиле с точки зрения вероятностей компонентов, которые можно понимать геометрически с точки зрения событий и как показано ниже.BAB

Наборы событий

Предельная вероятность и задаются площадей соответствующих кругов. Все возможные результаты представлены как , что соответствует набору событий « или ». В совместных вероятностей соответствует событию « и ».P ( B ) P ( A B ) = 1 A B P ( A B ) A BP(A)P(B)P(AB)=1AB P(AB)AB

В этом контексте условные вероятности в теореме Байеса можно понимать как отношения площадей. Вероятность данного - это доля занятая , выраженная как Аналогично, вероятность заданная - это доля занятая , то есть B B A B P ( A | B ) = P ( A B )ABBAB

P(A|B)=P(AB)P(B)
BAAAB
P(B|A)=P(AB)P(A)

Теорема Байеса на самом деле является лишь математическим следствием приведенных выше определений, которые можно переформулировать как I найти эту симметричную форму теоремы Байеса гораздо легче запомнить. То есть идентичность сохраняется независимо от того, какой или помечен как «предыдущий» или «задний».p ( A ) p ( B )

P(B|A)P(A)=P(AB)=P(A|B)P(B)
p(A)p(B)

(Другой способ понимания приведенного выше обсуждения дан в моем ответе на этот вопрос с точки зрения «бухгалтерской таблицы».)


9

У @gung отличный ответ. Я хотел бы добавить один пример, чтобы объяснить «инициацию» в реальном примере.

Для лучшей связи с примерами из реального мира я хотел бы изменить обозначение, где использовать чтобы представить гипотезу ( A в вашем уравнении), и использовать E, чтобы представить доказательства. ( B в вашем уравнении.)HAEB

Таким образом, формула

P(H|E)=P(E|H)P(H)P(E)

Обратите внимание, что та же формула может быть записана как

P(H|E)P(E|H)P(H)

где означает пропорциональность, а P ( E | H ) - вероятность, а P ( H ) - приоритет . Это уравнение означает, что апостериор будет больше, если правая часть уравнения больше. И вы можете думать, что P ( E ) - это нормализационная константа, чтобы превратить число в вероятность (причина, по которой я говорю, что это константа, в том, что доказательство E уже дано).P(E|H)P(H)P(E)E

Для примера из реальной жизни, предположим, что мы делаем какое-то обнаружение мошенничества при транзакциях по кредитным картам. Тогда гипотезой будет где представленная транзакция является нормальной или мошеннической. (Я выбрал крайне несбалансированный случай, чтобы показать интуицию).H{0,1}

Из знаний предметной области мы знаем, что большинство транзакций было бы нормальным, только очень немногие являются мошенничеством. Допустим, эксперт сказал нам, что из 1000 будет мошенничеством. Таким образом , мы можем сказать , что до является Р ( Н = 1 ) = 0,001 и Р ( Н = 0 ) = 0,999 .11000P(H=1)=0.001P(H=0)=0.999

P(H|E)

E{0,1}

P(E=1|H=0)P(E=1|H=1)

E=1


P(H=0)0.999P(H=1)=0.001

1

Обратите внимание, что правило Байеса

P(a|b)=P(b,a)P(b)=P(b,a)P(b)P(a)P(a)

Обратите внимание на соотношение

п(б,a)п(б)п(a),

ВAп(б,a)знак равноп(б)п(a)

Интересно, что журнал этого соотношения также присутствует во взаимной информации:

I(A|B)=a,bP(a,b)logP(b,a)P(b)P(a)


0

P(A,B)

правдоподобие = пропорции строк сзади = пропорции столбцов

Приоритет и маргинал определяются аналогично, но основаны на «итогах» вместо определенного столбца.

маргинальный = общие пропорции строки предыдущий = общие пропорции столбца

Я считаю, что это помогает мне.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.