Разница между двумя и тремя ступенями в Лестнице Причинности

12

В «Книге причины» Иудеи Перл он говорит о том, что он называет Лестницей Причинности, которая, по сути, представляет собой иерархию, состоящую из разных уровней причинного мышления. Самый низкий уровень связан с паттернами ассоциации в наблюдаемых данных (например, корреляция, условная вероятность и т. Д.), Следующий фокусируется на вмешательстве (что произойдет, если мы намеренно изменим процесс генерирования данных каким-либо заранее заданным способом?), А третий - контрфактивный (что произойдет в другом возможном мире, если что-то произошло или не произошло)?

Что я не понимаю, так это то, как ступени два и три отличаются. Если мы задаем контрфактивный вопрос, разве мы не задаем вопрос о вмешательстве, чтобы свести на нет некоторые аспекты наблюдаемого мира?

causality

— dsaxton
источник

Это действительно по теме? Отвечая из любопытства

— Firebug

5

@ Firebug - причинность по теме? Если вы хотите вычислить вероятность контрафактных действий (например, вероятность того, что определенного лекарства было достаточно для чьей-либо смерти), вам необходимо это понять.

— Карлос Синелли

5

twitter.com/yudapearl/status/1069533953223155713 !

— Тим

13

Нет никакого противоречия между фактическим миром и действием интереса на интервенционном уровне. Например, курение до сегодняшнего дня и вынуждение бросить курить начиная с завтрашнего дня не противоречат друг другу, даже если можно сказать, что одно «отрицает» другое. Но теперь представьте следующий сценарий. Вы знаете Джо, курильщика на всю жизнь, у которого рак легких, и вы удивляетесь: а если бы Джо не курил в течение тридцати лет, он был бы здоров сегодня? В этом случае мы имеем дело с одним и тем же человеком, в то же время воображая сценарий, в котором действие и результат находятся в прямом противоречии с известными фактами.

Таким образом, основное различие между вмешательствами и контрфактуальностями заключается в том, что, в то время как в вмешательствах вы спрашиваете, что произойдет в среднем, если вы выполняете действие, в контрфактах вы спрашиваете, что произошло бы, если бы вы предприняли другой образ действий в конкретной ситуации. , учитывая, что у вас есть информация о том, что на самом деле произошло. Обратите внимание, что, поскольку вы уже знаете, что произошло в реальном мире, вам необходимо обновить информацию о прошлом в свете данных, которые вы наблюдали.

Эти два типа запросов математически различны, потому что они требуют разного уровня информации, на которую нужно ответить (контрафакты нуждаются в большем количестве информации, чтобы ответить) и еще более сложного языка, который будет сформулирован !.

Имея информацию, необходимую для ответа на вопросы по заданию 3, вы можете ответить на вопросы по заданию 2, но не наоборот. Точнее, вы не можете отвечать на контрфактические вопросы только с помощью интервенционной информации. Примеры, где происходит столкновение вмешательств и подделок, уже были приведены здесь в резюме, см. Этот пост и этот пост . Однако для полноты картины я приведу здесь также пример.

Пример ниже можно найти в Причинности, раздел 1.4.4.

$x =1$ $x=0$ $y=0$ $y=1$ $P(y|x) = 0.5~~~\forall x,y$

$P(Y = 1|do(X = 1)) - P(Y=1|do(X =0) = 0$

$P(Y_{0} = 0|X =1, Y = 1)$

На этот вопрос нельзя ответить только с помощью интервенционных данных, которые у вас есть. Доказательство простое: я могу создать две разные причинно-следственные модели, которые будут иметь одинаковые интервенционные распределения, но разные контрфактуальные распределения. Два приведены ниже:

$U$ $P(y, x)$

Обратите внимание, что в первой модели лечение ни на кого не влияет, поэтому процент тех пациентов, которые умерли при лечении, которые могли бы выздороветь, если бы они не принимали лечение, равен нулю.

Однако во второй модели лечение оказывает влияние на каждого пациента, и мы имеем смесь двух групп населения, в которых средний причинный эффект оказывается равным нулю. В этом примере контрфактическое количество теперь достигает 100% - в модели 2 все пациенты, которые умерли под лечением, выздоровели бы, если бы не принимали лечение.

Таким образом, есть четкое различие между ступенью 2 и ступенью 3. Как показывает пример, вы не можете ответить на контрфактические вопросы только с помощью информации и предположений о вмешательствах. Это становится понятным с помощью трех шагов для вычисления контрфактуальности:

$P(u)$ $P(u|e)$
$do(x))$
$Y$

Это будет невозможно вычислить без некоторой функциональной информации о причинной модели или без некоторой информации о скрытых переменных.

— Карлос Синелли
источник

Интересный ответ! Пара последующих действий: 1) Вы говорите: « С информацией о Зоне 3 вы можете ответить на вопросы по Зоне 2, но не наоборот ». Но в вашем примере с курением я не понимаю, как зная, будет ли Джо здоров, если бы он никогда не курил, отвечает на вопрос «Будет ли он здоров, если завтра бросит курить после 30 лет курения». Они кажутся разными вопросами, поэтому я думаю, что что-то упустил.

— mkt - Восстановить Монику

Кроме того, ваш последующий обработанный пример опирается на то, что 2 ненаблюдаемые переменные были случайно распределены между лечением и контролем. Но вы описали это как рандомизированный эксперимент - не правда ли, это случай плохой рандомизации? При правильной рандомизации я не вижу, как вы получите два таких разных результата, если я не пропущу что-то базовое.

— mkt - Восстановить Монику

@mkt от последнего к первому. Ненаблюдаемая переменная распределяется случайным образом между обработанным и контрольным, у вас есть ровно 50% каждой категории u в обеих руках. Под информацией мы подразумеваем частичную спецификацию модели, необходимую для ответа на контрфактические запросы в целом, а не для ответа на конкретный запрос. Чтобы ответить на контрфактуальные запросы, вам нужна причинно-следственная структура + некоторая функциональная информация или информация о распределении скрытых переменных.

— Карлос Синелли

0

Вот ответ, который Иудея Перл дала в твиттере :

Читатели спрашивают: почему вмешательство (Rung-2) отличается от контрфактуального (Rung-3)? Разве вмешательство не отрицает некоторые аспекты наблюдаемого мира?

Отв. Вмешательства меняются, но не противоречат наблюдаемому миру, потому что мир до и после вмешательства влечет за собой переменные во времени. Напротив, «Если бы я был мертв» противоречит известным фактам. Для недавнего обсуждения, смотрите это обсуждение .

Примечание: и группа Гарвардского университета #causalinference, и схема потенциальных результатов Рубина не отличают Rung-2 от Rung-3.

Это, я считаю, культурное сопротивление, которое будет исправлено в будущем. Это вытекает из происхождения обеих структур в метафоре «как будто рандомизированный», в отличие от физической «слушающей» метафоры #Bookofwhy

— Бенджамин Крузье
источник