Если «B более вероятно дано A», то «A более вероятно дано B»


9

Я пытаюсь получить более ясную интуицию: «Если A делает B более вероятным, то B делает A более вероятным», т.е.

Пусть n(S) обозначает размер пространства, в котором находятся A и B , тогда

Утверждение: P(B|A)>P(B) поэтому n(AB)/n(A)>n(B)/n(S)

поэтому N(AВ)/N(В)>N(A)/N(S)

который является п(A|В)>п(A)

Я понимаю математику, но почему это имеет интуитивный смысл?


1
Я отредактировал вопрос, чтобы убрать слово «сделать». Этот вопрос немного походил на эти неоднозначные вопросы на Facebook, где вам нужно решить какую-то алгебраическую сумму с помощью изображений, и люди получают совершенно разные ответы из-за разной интерпретации вопроса. Это не то, что мы хотим здесь. (альтернатива состоит в том, чтобы закрыть вопрос за непонятность и заставить ОП изменить его).
Секст Эмпирик

Ответы:


10

Интуиция подсказывает, что примеры из реального мира, такие как Питер Флом, наиболее полезны для некоторых людей. Другая вещь, которая обычно помогает людям - это картинки. Итак, чтобы охватить большинство баз, давайте немного фотографий.

Диаграмма условной вероятности, показывающая независимость Диаграмма условной вероятности, показывающая зависимость

То, что мы имеем здесь, это две очень простые диаграммы, показывающие вероятности. Первый показывает два независимых предиката, которые я назову Red и Plain. Понятно, что они независимы, потому что линии выстраиваются. Пропорция красной области равняется той же пропорции, что и красной полосе, а также общей доле красного.

На втором изображении у нас есть независимые распределения. В частности, мы расширили часть простой красной области в полосатую область, не меняя того факта, что она красная. Тогда ясно, что красный цвет делает вас более правдоподобным.

А пока взгляните на простую сторону этого изображения. Очевидно, что доля простой области, которая красная, больше, чем доля всего изображения, которая красная. Это связано с тем, что равнине было выделено больше площади, и все это красное.

Таким образом, красный цвет делает равнину более вероятной, а простая - более вероятной.

Что на самом деле здесь происходит? A является свидетельством B (то есть, A делает B более вероятным), когда область, которая содержит и A, и B, больше, чем было бы предсказано, если бы они были независимыми. Поскольку пересечение между A и B такое же, как пересечение между B и A, это также означает, что B является доказательством для A.

Одно предостережение: хотя приведенный выше аргумент кажется очень симметричным, это может быть не тот случай, когда сила доказательств в обоих направлениях одинакова. Например, рассмотрим это третье изображение. Здесь произошло то же самое: чистый красный съел территорию, ранее принадлежавшую полосатой красной. На самом деле, он полностью закончил работу!Диаграмма условной вероятности, показывающая экстремальную зависимость

Обратите внимание, что точка, обозначенная красным цветом, гарантирует четкость, потому что не осталось полос с красными областями. Тем не менее, точка, в которой все ясно, не имеет гарантированного покраснения, потому что остаются зеленые области. Тем не менее, точка в прямоугольнике, являющаяся равниной, увеличивает вероятность того, что она является красной, а точка, являющаяся красной, увеличивает вероятность того, что она является простой. Оба направления предполагают более вероятно, но не на одну и ту же сумму.


Мне нравятся изображения :) Однако, похоже, что изображения или объяснение перевернуто: In the second image, we have non-independent distributions. Specifically, we have moved some of the stripy red area into the plain area without changing the fact that it is red. Clearly then, being red makes being plain more likely. - ваше второе изображение получило ровную область, чем первое, поэтому, переходя от изображения 1 к 2, мы переместили простую область в полосатую область.
Под

Итак, если у меня есть диаграмма Венна с некоторой общей областью пересечения A, B, и все, что я делаю, это увеличиваю эту область пересечения, я автоматически добавляю больше A, B для всего пространства (не увеличивая пространство) и меняю / увеличиваю n (A ) / n (S) и n (B) / n (S) как следствие. Правильно? Еще комментарии?
Рахул Деора

4
Красный против зеленого - проблемная комбинация для дальтоников.
Ричард Харди

@Pod Я думаю, что это неясность языка, которую вы описываете. Прочитайте «мы переместили часть полосатой красной области в простую область», как «мы переместили часть области, ранее известной как полосатой красной, и превратили ее в простую область». Я думаю, что вы [неправильно] прочитали это как «мы расширили часть полосатой красной области в область, ранее известную как равнина» .
Питер - Восстановить Монику

20

Я думаю, что другой математический способ выразить это может помочь. Рассмотрим утверждение в контексте правила Байеса:

Утверждение: если п(В|A)>п(В) то п(A|В)>п(A)

Правило Байеса:

P(AB)=P(BA)P(A)P(B)

предполагая, что P(B) отлично от нуля. таким образом

P(A|B)P(A)=P(B|A)P(B)

Если P(B|A)>P(B) , тоP(B|A)P(B)>1.

Тогда P(A|B)P(A)>1, и поэтомуP(A|B)>P(A).

Это доказывает утверждение и еще более сильный вывод - что соответствующие пропорции вероятностей должны быть равны.


Мне это понравилось , потому что он показывает более сильную связь « если А делает В х процентов больше шансов, то B делает х процентов больше шансов»
probabilityislogic

@probabilityislogic Если сформулировать это так, возникает двусмысленность. Если предыдущая вероятность составляет 10%, а задняя - 15%, увеличилась ли вероятность на 5% (15% минус 10%) или на 50% (15% делится на 10%)?
накопление

Более простое доказательство: если , то, используя это и правило Байеса, имеем P ( A | B ) = P ( B | A ) P ( A ) / P ( B ) > P ( B ) P ( A ) / PP(B|A)>P(B)P(A|B)=P(B|A)P(A)/P(B)>P(B)P(A)/P(B)=P(A)
Луч

12

Ну, мне не нравится слово «делает» в вопросе. Это подразумевает некоторую причинность, и причинность обычно не меняется.

Но вы просили интуицию. Итак, я подумаю о некоторых примерах, потому что это, кажется, пробуждает интуицию. Выберите тот, который вам нравится:

Если человек - женщина, более вероятно, что человек проголосовал за демократа.
Если человек проголосовал за демократа, более вероятно, что он женщина.

Если мужчина является профессиональным баскетбольным центром, более вероятно, что он выше 2 метров.
Если человек выше 2 метров, более вероятно, что он баскетбольный центр.

Если оно превышает 40 градусов по Цельсию, более вероятно, что произойдет отключение.
Если произошло отключение, более вероятно, что оно превышает 40 градусов.

И так далее.


4
Это не о вероятности. Это примерно 1 к 1 отношениям.
Питер Флом

6
@jww Представьте себе выражение «если идет дождь, улица мокрая» (и предположим, что это допустимое значение на данный момент, а обратное - нет). Теперь возьмите большое количество «образцов» в разное время и в разных местах, где вы записываете, идет ли дождь и мокрая ли улица. Улица будет влажной в большем количестве образцов, где идет дождь, чем в тех образцах, где ее нет; но также будет идти дождь в большем количестве образцов, где улица влажная, чем в тех местах, где улица сухая. Это вероятность.
Хоббс

3
Оба явления вызваны одним и тем же следствием; импликация работает только в одном направлении, но наблюдение за последующим повышает вероятность того, что вы смотрите на образец, в котором антецедент истинен.
Хоббс

7
@ Barmar Извините, но это частично демонстрирует правильность моей логики. Потому что, скажем, 36/25 000 намного больше, чем 1/150 000 000.
Питер Флом

7
Скорее, чем тот, кто ростом менее 2 метров.
Питер Флом

9

Чтобы добавить ответ @Dasherman: Что может означать, что два события связаны , или могут быть связаны или коррелированы ? Возможно, мы могли бы для определения сравнить совместную вероятность (предполагая, что P(A)>0,P(B)>0 ):

η(A,B)=P(AB)P(A)P(B)
поэтому, еслиηбольше единицы,AиBвстречаются вместе чаще, чем в условиях независимости. Тогда мы можем сказать, чтоAиB положительно связаны.

Но теперь, используя определение условной вероятности, P(AB)P(A)P(B)>1является простым следствиемP(BA)>P(B). НоP(AB)P(A)P(B)полностью симметричен вAаB(чередуя все вхождения символаAсBи наоборот) оставляет те же формулы, поэтому также эквивалентноP(AB)>P(A), Это дает результат. Таким образом, интуиция вы запрашиваете, чтоη(A,B)симметричнаAиB.

Ответ @gunes привел практический пример, и легко сделать других таким же образом.


2

Если A делает B более вероятным, это означает, что события как-то связаны. Это отношение работает в обе стороны.

Если A делает B более вероятным, это означает, что A и B имеют тенденцию происходить вместе. Это означает, что B также повышает вероятность A.


1
Это, возможно, может использовать какое-то расширение? Без определения связанных это немного пусто.
mdewey

2
Я пытался держаться подальше от всего строгого, так как ОП попросил интуитивное объяснение. Вы правы, что оно совершенно пустое, как сейчас, но я не уверен, как его расширить интуитивно. Я добавил попытку.
Дашерман

2

Если A делает B более вероятным, у A есть важная информация, которую B может сделать о себе. Несмотря на то, что она не может внести такую ​​же сумму, эта информация не теряется с другой стороны. В конце концов, у нас есть два события, которые их появление поддерживают друг друга. Я не могу представить себе сценарий, в котором появление A увеличивает вероятность B, а появление B уменьшает вероятность A. Например, если идет дождь, пол будет с высокой вероятностью мокрым, а если пол мокрый, это не значит, что шел дождь, но это не уменьшает шансы.


2

Вы можете сделать математику более интуитивной, представив таблицу непредвиденных обстоятельств.

A¬Aa+b+c+da+cb+dBa+bab¬Bc+dcd

  • AB

    A¬A1x1xBya=xyb=(1x)y¬B1yc=x(1y)d=(1x)(1y)
    P(A)=P(A|B) and P(B)=P(B|A).

  • When there is no independence then you could see this as leaving the parameters a,b,c,d the same (as products of the margins) but with just an adjustment by ±z

    A¬A1x1xBya+zbz¬B1yczd+z

    You could see this z as breaking the equality of the marginal and conditional probabilities or breaking the relationship for the joint probabilities being products of the marginal probabilities.

    Now, from this point of view (of breaking these equalities) you can see that this breaking happens in two ways both for P(A|B)P(A) and P(B|A)P(B). And the inequality will be for both cases > when z is positive and < when z is negative.

So you could see the connection P(A|B)>P(A) then P(B|A)>P(B) via the joint probability P(B,A)>P(A)P(B).

If A and B often happen together (joint probability is higher then product of marginal probabilities) then observing the one will make the (conditional) probability of the other higher.


2

Suppose we denote the posterior-to-prior probability ratio of an event as:

Δ(A|B)P(A|B)P(A)

Then an alternative expression of Bayes' theorem (see this related post) is:

Δ(A|B)=P(A|B)P(A)=P(AB)P(A)P(B)=P(B|A)P(B)=Δ(B|A).

The posterior-to-prior probability ratio tells us whether the argument event is made more or less likely by the occurrence of the conditioning event (and how much more or less likely). The above form of Bayes' theorem shows use that posterior-to-prior probability ratio is symmetric in the variables. For example, if observing B makes A more likely than it was a priori, then observing A makes B more likely than it was a priori.


Note that this is a probability rule, and so it should not be interpreted causally. This symmetry is true in a probabilistic sense for passive observation ---however, it is not true if you intervene in the system to change A or B. In that latter case you would need to use causal operations (e.g., the do operator) to find the effect of the change in the conditioning variable.


1

You are told that Sam is a woman and Kim is a man, and one of the two wears make-up and the other does not. Who of them would you guess wears make-up?

You are told that Sam wears make-up and Kim doesn't, and one of the two is a man and one is a woman. Who would you guess is the woman?


It is not so straightforward to connect this to the original problem. What exactly is event A and what is event B? Here it seems more like some comparison of probabilities. Event A is 'x is a women' (not A is the event 'x is a man'). And event B is 'x wears makeup'. But now we suddenly have a Sam and a Kim, where does that come from and should we use anything of information about the subjective masculinity or femininity of their names?
Sextus Empiricus

1

It seems there is some confusion between causation and correlation. Indeed, the question statement is false for causation, as can be seen by an example such as:

  • If a dog is wearing a scarf, then it is a domesticated animal.

The following is not true:

  • Seeing a domesticated animal wearing a scarf implies it is a dog.
  • Seeing a domesticated dog implies it is wearing a scarf.

However, if you are thinking of probabilities (correlation) then it IS true:

  • Dogs wearing scarfs are much more likely to be a domesticated animal than dogs not wearing scarfs (or animals in general for that matter)

The following is true:

  • A domesticated animal wearing a scarf is more likely to be a dog than another animal.
  • A domesticated dog is more likely to be wearing a scarf than a non-domesticated dog.

If this is not intuitive, think of a pool of animals including ants, dogs and cats. Dogs and cats can both be domesticated and wear scarfs, ants can't neither.

  1. If you increase the probability of domesticated animals in your pool, it also will mean you will increase the chance of seeing an animal wearing a scarf.
  2. If you increase the probability of either cats or dogs, then you will also increase the probability of seeing an animal wearing a scarf.

Being domesticated is the "secret" link between the animal and wearing a scarf, and that "secret" link will exert its influence both ways.

Edit: Giving an example to your question in the comments:

Imagine a world where animals are either Cats or Dogs. They can be either domesticated or not. They can wear a scarf or not. Imagine there exist 100 total animals, 50 Dogs and 50 Cats.

Now consider the statement A to be: "Dogs wearing scarfs are thrice as likely to be a domesticated animal than dogs not wearing scarfs".

If A is not true, then you can imagine that the world could be made of 50 Dogs, 25 of them domesticated (of which 10 wear scarfs), 25 of them wild (of which 10 wear scarfs). Same stats for cats.

Then, if you saw a domesticated animal in this world, it would have 50% chance of being a dog (25/50, 25 dogs out of 50 domesticated animals) and 40% chance of having a scarf (20/50, 10 Dogs and 10 Cats out of 50 domesticated animals).

However, if A is true, then you have a world where there are 50 Dogs, 25 of them domesticated (of which 15 wear scarfs), 25 of them wild (of which 5 wear scarfs). Cats maintain the old stats: 50 Cats, 25 of them domesticated (of which 10 wear scarfs), 25 of them wild (of which 10 wear scarfs).

Then, if you saw a domesticated animal in this world, it would have the same 50% chance of being a dog (25/50, 25 dogs out of 50 domesticated animals) but would have 50% (25/50, 15 Dogs and 10 Cats out of 50 domesticated animals).

As you can see, if you say that A is true, then if you saw a domesticated animal wearing a scarf in the world, it would be more likely a Dog (60% or 15/25) than any other animal (in this case Cat, 40% or 10/25).


This is the line I have a problem with "A domesticated animal wearing a scarf is more likely to be a dog than another animal." When we made our initial statement we did not make any claim on the other animals that could wear scarfs. There could be 100s. We only made a statement about dogs.
Rahul Deora

See if my edit helps with your particular issue.
H4uZ

0

There is a confusion here between causation and correlation. So I'll give you an example where the exact opposite happens.

Some people are rich, some are poor. Some poor people are given benefits, which makes them less poor. But people who get benefits are still more likely to be poor, even with benefits.

If you are given benefits, that makes it more likely that you can afford cinema tickets. ("Makes it more likely" meaning causality). But if you can afford cinema tickets, that makes it less likely that you are among the people who are poor enough to get benefits, so if you can afford cinema tickets, you are less likely to get benefits.


5
This isn't an answer to the question. Interesting, but not an answer. In fact, it's talking about a different scenario; the reason the opposite happens is that it's using two different metrics that are named similarly (poor without benefits v.s. poor with benefits) and as such is a completely different scenario.
wizzwizz4

0

The intuition becomes clear if you look at the stronger statement:

If A implies B, then B makes A more likely.

Implication:
  A true  -> B true
  A false -> B true or false
Reverse implication:
  B true  -> A true or false
  B false -> A false

Obviously A is more likely to be true if B is known to be true as well, because if B was false then so would be A. The same logic applies to the weaker statement:

If A makes B more likely, then B makes A more likely.

Weak implication:
  A true  -> B true or (unlikely) false
  A false -> B true or false
Reverse weak implication:
  B true  -> A true or false
  B false -> A false or (unlikely) true

I think what you are saying in the first statement is that in a venn diagram if A is contained in B, then if B is true n(A)/n(B) must be higher than n(A)/n(S) as B is a smaller space than S. Even in the second, you say likewise?
Rahul Deora

@RahulDeora - Yes, that's how it works. The weak version is much less obvious, but you already did the math anyway. What you asked for is the intuition behind the result, which can be best observed in the stronger statement.
Rainer P.

A small problem with using this statement to gain some more intuition is that it is not entirely true. 'A implying B' is not a sufficient condition for 'when B then A is more likely'. The important distinction is that with 'A implying B' does not need to make B more likely. The most important examples are when B is always true.
Sextus Empiricus

0

Suppose Alice has a higher free throw rate than average. Then the probability of a shot being successful, given that it's attempted by Alice, is greater than the probability of a shot being successful in general P(successful|Alice)>P(successful). We can also conclude that Alice's share of successful shots is greater than her share of shots in general: P(Alice|successful)>P(Alice).

Or suppose there's a school that has 10% of the students in its school district, but 15% of the straight-A students. Then clearly the percentage of students at that school who are straight-A students is higher than the district-wide percentage.

Another way of looking at it: A is more likely, given B, if P(A&B)>P(A)P(B), and that is completely symmetrical with respect to A and B.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.