Отношения между корреляцией и причинностью


19

На странице Википедии под названием корреляция не подразумевается причинно-следственная связь ,

Для любых двух коррелированных событий A и B различные возможные отношения включают в себя:

  1. А вызывает Б (прямая причинность);
  2. B вызывает A (обратная причина);
  3. А и В являются следствиями общего дела, но не вызывают друг друга;
  4. A и B оба вызывают C, который (явно или неявно) обусловлен .;
  5. A вызывает B и B вызывает A (двунаправленная или циклическая причина);
  6. A вызывает C, которое вызывает B (косвенная причина);
  7. Нет никакой связи между А и В; корреляция это совпадение.

Что означает четвертый пункт? A и B оба вызывают C, который (явно или неявно) обусловлен. Если A и B вызывают C, почему A и B должны быть соотнесены.


8
Обязательные связанные xkcd: xkcd.com/552
Тодд Уилкокс

2
Несмотря на высказывание, я ожидал бы, что будет высокая корреляция между корреляцией и причинностью ...
Mehrdad


Возможно, см. Также обсуждение в разделе « Нет корреляции, не подразумевает никакой причинности»?
ctwardy

Ответы:


18

«Кондиционирование» - это слово из теории вероятностей: https://en.wikipedia.org/wiki/Conditional_probability

Обусловливание на C означает, что мы рассматриваем только случаи, когда C истинно. «Неявно» означает, что мы можем не делать это ограничение явным, иногда даже не осознавая этого.

Точка означает, что, когда A и B оба вызывают C, наблюдая корреляцию между A и B в случаях, когда C истинно, не означает, что между A и B существуют реальные отношения. Это просто обусловливает C (возможно, неохотно), что создает искусственную корреляцию.

Давайте возьмем пример.

В стране существует ровно два вида болезней, совершенно независимых. Вызов A: «у человека первая болезнь», B: «у человека вторая болезнь». Предположим, что , .P ( B ) = 0,1п(A)знак равно0,1п(В)знак равно0,1

Теперь любой человек, у которого есть одно из этих заболеваний, идет к врачу и только потом. Звоните С: «человек идет к врачу». Мы имеем .Сзнак равноA или В

Теперь давайте посчитаем несколько вероятностей:

  • п(С)знак равно0,19
  • P(A|С)знак равноп(В|С)знак равно0,10,190,53
  • п(A и В|С)знак равно0,010,190,053
  • п(A|С)п(В|С)0,28

Ясно, что при условии C, и очень далеки от независимости. На самом деле, кондиционер на C, , кажется, «причина» .AВNоTAВ

Если вы используете список лиц, где записаны их врач (ами) в качестве источника данных для анализа, то есть , кажется, сильная корреляция между заболеваниями и . Вы можете не знать о том факте, что ваш источник данных является условием. Это также называется «смещением выбора».AВ


13

Четвертый пункт - пример парадокса Берксона , также известного как обусловливание на коллайдере , также известного как явление объяснения .

AttractiveAcceptCharming
AttractiveCharmingAccept

AttractiveCharmingAccept=1, Теперь предположим, что я расскажу вам о мужчине, с которым женщина согласилась встречаться, и скажу вам, что он (по мнению женщины) совсем не привлекателен. Что ж, мы знаем, что женщина все равно согласилась встречаться с ним, поэтому мы можем сделать разумный вывод, что он действительно очарователен. И наоборот, если мы узнаем о человеке, предложение которого на свидание было принято, и который не обаятелен, мы бы разумно предположили, что он должен быть довольно привлекательным.

Accept=1AttractiveCharmingAccept


5

Парадокс Симпсона и парадокс Берксона в каждый может привести примеры «A и B как причина С, что (явно или неявно) обусловлено»

100010010%20020%20

28020%100%


Это пример парадокса Берксона, а не парадокса Симпсона (см. Мой ответ).
Джейк Уэстфолл,

@JakeWestfall Вы, вероятно, правы - я знал, что где-то ранее писал пример с марками, но забыл, где, и оказывается страница Википедии для парадокса Берксона
Генри

4

Абзац начинается с «Для любых двух коррелированных событий, A и B, ...», поэтому я предполагаю, что корреляция предполагается в начале. Другими словами, они не должны коррелировать, чтобы одновременно вызывать С, но если они коррелировали и оба они вызывали С, это не означает, что между ними существует причинно-следственная связь.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.