Какова интуиция за формулой условной вероятности?


30

Формула для условной вероятности от A происходящее при условии , что B произошло то:

P(A | B)=P(AB)P(B).

Мой учебник объясняет интуицию за этим в терминах диаграммы Венна.

введите описание изображения здесь

Принимая во внимание тот факт, что B произошел, единственный способ возникновения - это попадание события на пересечение и .AAB

В этом случае вероятность просто не будет равна вероятности пересечения , поскольку это единственный способ, которым событие могло произойти? Что мне не хватает?P(A|B)AВ


7
Есть ли у вас интуитивное понимание того, что условная вероятность «есть», если мы на время забудем, как ее вычислить?
Юхо Коккала

4
Обусловливая B (событие, которое произошло ), вы ограничиваете пространство результатов от (весь план) только до B. Вы забываете все, что находится за пределами B. Вероятность события A должна измеряться относительно B, так как вероятность составляет от 0 до 1.Ω
Владислав Довгальец

1
Вам не хватает того факта, что белая часть круга события А больше не является частью населения, если вы знаете, что произошло событие B.
Монти Хардер

4
Интуиция не является точной и не единственной, поэтому зачем спрашивать о (единственной) точной интуиции? Достаточно полезной интуиции, но не все предложения будут полезны всем людям.
Джон Колман

Ответы:


23

Хорошая интуиция дается, что B произошел - с или без A - какова вероятность A? Т.е. мы сейчас находимся во вселенной, в которой произошел B - полный правый круг. В этом круге вероятность А - это площадь пересечения А, разделенная на площадь круга.


5
Другими словами - я говорю вам, что произошло, что означает, что мы живем в B круге. В этом мире, какой% событий находится в объективе ( A B )? BBAВ
MichaelChirico

18

Я думаю об этом так: я принимаю как должное, что вы понимаете интуицию до тех пор, пока:

Принимая во внимание тот факт, что B произошел, единственный путь для A - это падение даже на пересечении A & B.

и я собираюсь прокомментировать второе изображение, которое вы разместили:

  1. Представьте, что весь белый прямоугольник является вашим образцом пространства .Ω

    Назначение вероятности для набора означает, что вы измеряете в некотором смысле этот набор. Это так же, как если бы вы измерили площадь прямоугольника, но вероятность - это другой вид измерения, обладающий определенными свойствами (я не буду больше говорить об этом).

  2. Вы знаете, что и это интерпретируется так:P(Ω)=1

    представляет все события, которые могут произойти, и что-то должно произойти, поэтому у нас есть 100% вероятность того, что что-то случится.Ω

  3. Аналогично, множество имеет вероятность P ( A ), которая пропорциональна вероятности выборочного пространства Ω . Графически вы видите, что A Ω, следовательно, мера A (его вероятность P ( A ) ) должна быть меньше, чем P ( Ω ) . То же рассуждение справедливо для множества B . Этот набор может быть измерен, и его мера P ( A B ) .AP(A)ΩAΩAP(A)P(Ω)ABP(AB)

  4. Если теперь вам говорят, что произошло, вы должны думать, как будто Б был вашим «новым» Ω . Если B является вашим «новым» Ω , то вы можете быть на 100% уверен , что все происходит в множестве B .BBΩBΩВ

    И что это значит? Это означает , что теперь, в «новом» конкурса , и вы должны изменить масштаб всех вероятностных мер, принимая во внимание , что они должны быть выражены в терминах «нового» образца пространства B . Это простая пропорция.P(BB)=1В

    Ваша интуиция почти правильна, когда вы говорите, что:

вероятность P (A | B) будет просто равна вероятности пересечения A B

и «почти» связано с тем , что теперь ваш выборочное пространство изменилось (это сейчас) , и вы хотите Rescale P ( B ) соответственно.Вп(AВ)

  1. Ваш P ( B ) в новом мирегде выборочное пространство теперь B . Словами вы бы сказали это так (и, пожалуйста, попробуйте визуализировать это на изображении с наборами):п(A|В)п(AВ)В

    В новом мире отношение между мерой и мерой A B должно быть таким же, как отношение между мерой Ω и мерой A BВAВΩA|В

  2. Наконец, переведите это на математический язык (простая пропорция):

п(В):п(AВ)знак равноп(Ω):п(A|В)

и поскольку то следует, что:п(Ω)знак равно1

п(A|В)знак равноп(AВ):п(В)

5

Вы увидите, что интуиция легко думает о следующей проблеме.

Предположим, у вас есть 10 шаров: 6 черных и 4 красных. Из черных шаров 3 удивительны, а из красных шаров только 1 удивительны. Насколько вероятно, что черный шар тоже потрясающий?

Ответ очень прост: это 50%, потому что у нас есть 3 удивительных черных шара из 6 черных.

Вот как вы отображаете вероятности для нашей проблемы:

  • 3 шара, которые являются черными и удивительными, соответствуют P(AB)
  • 6 черных шаров соответствуют P(B)
  • вероятность того, что шар является Крутой, когда мы ЗНАЕМ, что это черный: P(AB)

1
Разве не имеет смысла писать а не P ( B ) = 6 ? n(B)=6P(B)=6
Серебряная

@Silverfish Это было бы более точно, но я был после интуиции в этом случае
Аксакал

4

Для базовой интуиции формулы условной вероятности мне всегда нравится использовать двустороннюю таблицу. Скажем, в годовой группе 150 студентов, из которых 80 женщин и 70 мужчин, каждый из которых должен изучать ровно один языковой курс. Двусторонняя таблица студентов, проходящих разные курсы:

        | French   German   Italian  | Total
-------- --------------------------- -------
Male    |     30       20        20  |    70
Female  |     25       15        40  |    80
-------- --------------------------- -------
Total   |     55       35        60  |   150

Учитывая, что студент проходит курс итальянского языка, какова вероятность того, что он женский? Итак, курс итальянского языка насчитывает 60 студентов, из которых 40 женщин изучают итальянский язык, поэтому вероятность должна быть:

P(F|Italian)=n(FItalian)n(Italian)=4060знак равно23

где является мощность множества А , то есть количество элементов , которые он содержит. Обратите внимание, что нам нужно было использовать n ( F итальянский ) в числителе, а не только n ( F ) , потому что последний включал бы всех 80 женщин, включая 40 других, которые не изучают итальянский язык.N(A)AN(Fитальянский)N(F)

Но если бы вопрос был изменен, какова вероятность того, что студент пойдет на курс итальянского, учитывая, что он - женщина? Затем 40 из 80 студенток проходят курс итальянского, поэтому у нас есть:

п(Итальянский | F)знак равноN(итальянскийF)N(F)знак равно4080знак равно12

Я надеюсь, что это дает понять, почему

п(A|В)знак равноN(AВ)N(В)

Понимание того, почему дробь может быть записана с вероятностями вместо числа элементов, является вопросом эквивалентных дробей . Например, давайте вернемся к вероятности того, что студентка - женщина, учитывая, что они изучают итальянский язык. Всего 150 студентов, поэтому вероятность того, что студент - женщина и изучает итальянский, составляет 40/150 (это «совместная» вероятность), а вероятность того, что студент изучает итальянский, составляет 60/150 (это «предельная» вероятность). ). Обратите внимание, что деление общей вероятности на предельную вероятность дает:

P(FItalian)P(Italian)=40/15060/150знак равно4060знак равноN(Fитальянский)N(итальянский)знак равноп(F | Italian)

(Чтобы увидеть, что дроби эквивалентны, умножающий числитель и знаменатель на 150 удаляет «/ 150» в каждом.)

В более общем случае, если ваше пространство выборки имеет мощность n ( Ω ) - в этом примере мощность равна 150 - мы находим, чтоΩN(Ω)

п(A|В)знак равноN(AВ)N(В)знак равноN(AВ)/N(Ω)N(В)/N(Ω)знак равноп(AВ)п(В)

3

Я бы изменил логику. Вероятность того, что и и B либо:AB

  1. Вероятность произошло, и что , учитывая , что произошло.BA
  2. То же, но поменялись ролями для и BAВ

Это даст вам

п(AВ)знак равноп(В)п(A|В)

Если вы ищете негатив в своем предложении, то, хотя это правда, что вероятность данного B содержится в вероятности продукта, пространство, в которое вы бросаете кубик, меньше вашего исходного вероятностного пространства - вы знаете, наверняка вы "в" B , следовательно, вы делите на размер нового пространства.AВВ


2

Диаграмма Венна не представляет вероятности, она представляет меру подмножеств пространства событий. Вероятность - это соотношение между двумя показателями; вероятность X - это размер «всего, что составляет X», деленного на размер «всех рассматриваемых событий». Каждый раз, когда вы рассчитываете вероятность, вам нужно и «пространство успеха», и «пространство населения». Вы не можете рассчитать вероятность, основываясь только на том, «насколько велика» область успеха. Например, вероятность броска семерки с двумя кубиками - это число способов броска семерки, деленное на общее количество способов броска двух кубиков. Просто знать количество способов бросить семерку недостаточно для вычисления вероятности. P (A | B) - отношение меры "и A и B происходят" пространство и мера "B случается" пространство. Это то, что "|" означает: это означает «сделать то, что идет после этого населенного пункта».


2

Я думаю, что лучший способ думать об этом - это рисовать пошаговые пути.

Давайте опишем событие B как бросание на честном кубике - это легко показать, чтобы иметь вероятность 14 . Теперь давайте опишем событие A как вытягивание туза из стандартной 52-карточной колоды - это может быть легко показано с вероятностью116 .113

Давайте теперь запустим эксперимент, где мы бросаем кубик, а затем выбираем карту. Так что вероятность того, что мы начнем рисовать туза, учитывая, что мы уже бросили 4 . Если вы посмотрите на изображение, это будет 1P(A|B)4 путь (идти вверх), а затем116 дорожка (поднимитесь снова).113

Интуитивно понятно, что общее пространство вероятностей - это то, что нам уже дано: переход на . Мы можем игнорировать 14 и12113 начальный путь вниз ведет к тому, что мы дали4. По закону умножения, наше общее пространство равно(112134.(16×113)+(16×1213)

Теперь, какова вероятность того, что мы нарисовали туза, дали, что мы бросили ? Ответ с помощью пути ( 14, который мы затем должны разделить на общее пространство. Таким образом, мы получаемP(A(16×113)

п(A|В)знак равно16×113(16×113)+(16×1213),

enter image description here


2
Мне было интересно, для чего был понижающий голос, потому что деревья вероятности могут быть очень поучительными. Возможно, проблема заключается в том, что использование независимых событий для иллюстрации упускает саму точку условной вероятности, которая заключается в том, что распределение вероятностей может изменяться в зависимости от события обусловленности. Использование менее поверхностной иллюстрации может помочь.
whuber

1

Думайте об этом с точки зрения количества. Предельная вероятность - сколько раз произошло А, деленное на размер выборки. Совместная вероятность A и B - это то, сколько раз A происходило вместе с B, деленное на размер выборки. Условная вероятность A данного B - это сколько раз A произошло вместе с B, поделенное на то, сколько раз B произошло, то есть только A внутри «B».

Вы можете найти хорошую визуальную иллюстрацию в этом блоге , которая показывает его с помощью блоков Lego.


1

На момент написания статьи было около 10 ответов, которые, кажется, все упускают самый важный момент: вы по существу правы.

В таком случае, не будет ли вероятность P (A | B) просто равна вероятности пересечения A B, так как это единственный способ, которым событие может произойти?

Это определенно правда. Это объясняет, почему количество мы определяемп(A|В) на самом деле п(AВ) пересчитывается.

Чего мне не хватает?

Вам не хватает того, что вероятность того, что B будет удовлетворен, учитывая, что B удовлетворяется, должна быть 1, поскольку это вполне определенное событие, а не п(ВВ)знак равноп(В) который может быть меньше 1. Деление на п(В)делает условную вероятность B заданной B равной 1, как и ожидалось. На самом деле это еще лучше и делает картуAп(A|В) вероятность - значит, условная вероятность на самом деле является вероятностью.


0

Я чувствую, что это более интуитивно понятно, когда у нас есть конкретные данные для оценки вероятностей.

Давайте использовать mtcarsданные в качестве примера, данные выглядят так (мы используем только количество цилиндров и тип передачи).

> mtcars[,c("am","cyl")]
                    am cyl
Mazda RX4            1   6
Mazda RX4 Wag        1   6
Datsun 710           1   4
Hornet 4 Drive       0   6
...  
...
Ford Pantera L       1   8
Ferrari Dino         1   6
Maserati Bora        1   8
Volvo 142E           1   4

Мы можем рассчитать совместное распределение по двум переменным, выполнив перекрестную таблицу:

> prop.table(table(mtcars$cyl,mtcars$am))

          0       1
  4 0.09375 0.25000
  6 0.12500 0.09375
  8 0.37500 0.06250

Совместная вероятность означает, что мы хотим рассматривать две переменные одновременно. Например, мы спросим, ​​сколько машин имеют 4 цилиндра и механическую коробку передач.

Теперь мы подошли к условной вероятности. Я нашел наиболее интуитивный способ объяснить условную вероятность с помощью термина « фильтрация данных».

Предположим, мы хотим получить п(aмзнак равно1|сYLзнак равно4), сделаем следующие оценки:

> cyl_4_cars=subset(mtcars, cyl==4)
> prop.table(table(cyl_4_cars$am))

        0         1 
0.2727273 0.7272727 

Это означает, что мы заботимся только о машинах с 4 цилиндрами. Таким образом, мы фильтруем данные об этом. После фильтрации проверяем, сколько из них имеют механическую коробку передач.

Вы можете сравнить это с суставом, о котором я упоминал ранее, чтобы почувствовать разницу.


0

Если Aбыли надмножеством Bвероятности того, что Aпроисходит всегда 1 при условии , что Bпроизошло, то есть P(A|B) = 1. Однако Bсама вероятность может быть намного меньше 1.

Рассмотрим следующий пример:

  • дано xнатуральное число в 1..100,
  • Aэто « xчетное число»
  • Bэто xделится на 10

тогда мы имеем:

  • P(A) 0,5
  • P(B) 0,1

Если мы знаем, что xэто делится на 10 (т.е. xнаходится в B), мы знаем, что это также четное число (то xесть в A), поэтому P(A|B) = 1.

Из правила Байеса имеем:

п(A|В)знак равноп(AВ)п(В)

обратите внимание, что в нашем (особом) случае п(AВ)То есть вероятность того, что xэто и четное число, и число, делимое на 10, равно вероятности, что xэто число, делимое на 10. Поэтому мы имеемп(AВ)знак равноп(В) и подключив это обратно в правило Байеса, мы получаем п(A|В)знак равноп(В)/п(В)знак равно1,


Для невырожденного примера рассмотрим, например A, « xделится на 7» и B« xделится на 3». Тогда P(A|B)эквивалентно «учитывая, что мы знаем, что xоно делится на 3, какова вероятность того, что оно (также) делится на 7?». Или, что то же самое, «какая часть чисел 3, 6, ..., 99 делится на 7»?


0

Я думаю, что ваше первоначальное утверждение может быть недоразумением.

Вы написали:

Формула для условной вероятности того, что А случится после того, как это произошло, имеет вид

Исходя из вашей фразы, это может звучать так, как будто есть 2 события: «Сначала произошло B, а затем мы хотим вычислить вероятность того, что произойдет A».

Это не вариант. (Следующее действительно, было ли недоразумение или нет).

У нас всего 1 событие, которое описывается одной из 4 возможностей:

  1. ни A ни В;

  2. только что Aне В;

  3. только что Вне A;

  4. и то и другое A а также В,

Положив некоторые примерные цифры, скажем,

п(A)знак равно0,5,п(В)знак равно0,5,а такжеА и В независимы,

Следует, что

п(А и Б)знак равно0,25а такжеп(ни А, ни Б)знак равно0.25.

Первоначально (не зная об этом событии), мы знали п(AB)знак равно0,25,

Но как только мы узнаем, что В случилось, мы в другом пространстве. п(AB) это половина п(В) поэтому вероятность A данный В, п(A|В), является 0,5, Нет0,25, знаю это В случилось.


0

Вероятность обусловленности НЕ равна вероятности пересечения. Вот интуитивный ответ:

1) п(В|A): "Мы знаем это Aполучилось. Какова вероятность того, чтоВ случится?"

2: п(AВ) : "Мы не знаем, A или Вслучилось Какова вероятность того, что оба произойдут?

Разница в том, что в первом у нас есть дополнительная информация (мы знаем, что Aпроисходит первым). Во втором мы ничего не знаем.

Начиная с вероятности второго, мы можем вывести вероятность первого.

Событие, которое как A а также В произойти может произойти двумя способами:

1) Вероятность A И вероятность В при условии A получилось.

2) Вероятность В И вероятность A при условии В получилось.

Оказывается, обе ситуации одинаково похожи на те, которые происходят. (Я не могу сам узнать интуитивную причину). Таким образом, мы должны взвесить оба сценария0,5

п(AВ)знак равно1/2*п(A(В|A))+1/2*п(В(A|В))

Теперь используйте это A а также В|A независимы и помните, что оба сценария одинаково вероятны.

п(AВ)знак равноп(A)*п(В|A)

Тадааа ... теперь изолирую вероятность обусловленности!

Кстати. Я был бы рад, если бы кто-то мог объяснить, почему сценарии 1 и 2 равны. Ключ лежит там ИМО.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.