Является ли это правильным способом постоянного обновления вероятности с помощью теоремы Байеса?


9

Допустим, я пытаюсь выяснить вероятность того, что чей-то любимый аромат мороженого - ваниль.

Я знаю, что человек также любит фильмы ужасов.

Я хочу выяснить вероятность того, что любимое мороженое этого человека - ванильное, учитывая, что ему нравятся фильмы ужасов.

Я знаю следующие вещи:

  1. людей выбирают ваниль в качестве своего любимого вкуса мороженого. (Это мой П ( А ) )5%P(A)
  2. людей, фаворитом которых является ванильное мороженое, также любят фильмы ужасов. (Это мой P ( B | A ) )10%P(B|A)
  3. людей, чье любимое не ванильное мороженое, тоже любят фильмы ужасов (это мой P ( B | ¬ A ) )1%P(B|¬A)

Итак, я рассчитываю это так: Я считаю, чтоP(A|B)=0,3448(округлено до ближайшей десятитысячной). Естьвероятность34,48% того,что любимый вкус мороженого у фанатов фильмов ужасов - ваниль.

P(A|B)=0.05×0.1(0.05×0.1)+(0.01×(10.05))
P(A|B)=0.344834.48%

Но потом я узнаю, что человек видел фильм ужасов за последние 30 дней. Вот что я знаю:

  1. - обновленная апостериорная вероятность того, что ваниль - любимый вкус мороженого человека - P ( A ) в этой следующей проблеме.34.48%P(A)
  2. 20%
  3. 5%

0.3448×0.2(0.3448×0.2)+(0.05×(10.3448))=0.6779

67.79%

Но подождите, есть другая вещь. Я также узнал, что человек владеет кошкой.

Вот что я знаю:

  1. 67.79%P(A)
  2. 40%
  3. 10%

0.6779×0.4(0.6779×0.4)+(0.1×(10.6779))=0.8938

Мой вопрос в основном сводится к следующему: правильно ли я обновляю вероятность, используя теорему Байеса? Что-то не так в моих методах?


1
любовь = любимая? Вы не публикуете степени любви. если вам это нравится, это ваш любимый. уточнить при необходимости.
generic_user

Хорошая точка зрения. Я изменил «любовь» на «любимый». Это не грамматически правильно, но это менее многословно, чем говорить «выбирайте ваниль для их любимого вкуса мороженого». Я надеюсь, что это проясняет ситуацию.
user1626730

Ответы:


7

Это не правильно. Последовательное обновление этого типа работает только тогда, когда информация, которую вы получаете последовательно, является независимой (например, при наблюдениях случайной величины). Если каждое наблюдение не является независимым, как в этом случае, вам необходимо рассмотреть совместное распределение вероятностей. Правильный способ обновления - вернуться к предыдущему, найти общую вероятность того, что кто-то любит фильмы ужасов, видел фильмы ужасов за последние 30 дней и владеет кошкой, учитывая, что он выбирает или не выбирает ваниль в качестве своего любимый вкус мороженого, а затем обновить за один шаг.

Такое последовательное обновление, когда ваши данные не являются независимыми, быстро увеличит вашу последнюю вероятность намного выше или ниже, чем должно быть.


1
Как вы понимаете, когда информация, которую вы получаете последовательно, независима? Если вы имеете в виду «независимо от события, которое вы пытаетесь предсказать», знаете ли вы, как я могу определить, является ли информация, которую я получаю, независимой?
user1626730

Условно независимы, учитывая событие, которое вы пытаетесь предсказать. Если бы они были независимы от события, которое вы пытаетесь предсказать, они бы не помогли вам. Что касается того, как вы можете сказать - вы должны думать о том, что ваши данные. В этом случае то, смотрел ли кто-нибудь фильм ужасов за последние 30 дней, явно не зависит от того, любят ли они фильмы ужасов.
Джонатан Кристенсен

Когда вы говорите «условно независимый», я предполагаю, что вы имеете в виду, что каждый P (B) (то есть любящий фильмы ужасов, владение кошкой) не связан друг с другом? Если так, то не будет ли переменная владения кошкой независимой от любителей фильмов ужасов?
user1626730

Да, вы можете утверждать, что владение кошкой не зависит от любви к фильмам ужасов. Это не обязательно, хотя - например, возможно, женщины и с большей вероятностью любят кошек, и с меньшей вероятностью любят фильмы ужасов.
Джонатан Кристенсен

Хм, я не совсем уверен, что вы имеете в виду, добавляя немного о женщинах и кошках. Не могли бы вы объяснить, пожалуйста?
user1626730 19.12.12
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.