«Кондиционирование» - это слово из теории вероятностей: https://en.wikipedia.org/wiki/Conditional_probability
Обусловливание на C означает, что мы рассматриваем только случаи, когда C истинно. «Неявно» означает, что мы можем не делать это ограничение явным, иногда даже не осознавая этого.
Точка означает, что, когда A и B оба вызывают C, наблюдая корреляцию между A и B в случаях, когда C истинно, не означает, что между A и B существуют реальные отношения. Это просто обусловливает C (возможно, неохотно), что создает искусственную корреляцию.
Давайте возьмем пример.
В стране существует ровно два вида болезней, совершенно независимых. Вызов A: «у человека первая болезнь», B: «у человека вторая болезнь». Предположим, что , .P ( B ) = 0,1п( А ) = 0,1п( В ) = 0,1
Теперь любой человек, у которого есть одно из этих заболеваний, идет к врачу и только потом. Звоните С: «человек идет к врачу». Мы имеем .С= A или B
Теперь давайте посчитаем несколько вероятностей:
- п( C) = 0,19
- п( A | C) = P( B | C) =0.10,19≈ 0.53
- п( А и В | С) = 0,010,19≈ 0.053
- п( A | C) P( B | C) ≈ 0,28
Ясно, что при условии C, и очень далеки от независимости. На самом деле, кондиционер на C, , кажется, «причина» .AВп о тВ
Если вы используете список лиц, где записаны их врач (ами) в качестве источника данных для анализа, то есть , кажется, сильная корреляция между заболеваниями и . Вы можете не знать о том факте, что ваш источник данных является условием. Это также называется «смещением выбора».AВ