Нет никакого противоречия между фактическим миром и действием интереса на интервенционном уровне. Например, курение до сегодняшнего дня и вынуждение бросить курить начиная с завтрашнего дня не противоречат друг другу, даже если можно сказать, что одно «отрицает» другое. Но теперь представьте следующий сценарий. Вы знаете Джо, курильщика на всю жизнь, у которого рак легких, и вы удивляетесь: а если бы Джо не курил в течение тридцати лет, он был бы здоров сегодня? В этом случае мы имеем дело с одним и тем же человеком, в то же время воображая сценарий, в котором действие и результат находятся в прямом противоречии с известными фактами.
Таким образом, основное различие между вмешательствами и контрфактуальностями заключается в том, что, в то время как в вмешательствах вы спрашиваете, что произойдет в среднем, если вы выполняете действие, в контрфактах вы спрашиваете, что произошло бы, если бы вы предприняли другой образ действий в конкретной ситуации. , учитывая, что у вас есть информация о том, что на самом деле произошло. Обратите внимание, что, поскольку вы уже знаете, что произошло в реальном мире, вам необходимо обновить информацию о прошлом в свете данных, которые вы наблюдали.
Эти два типа запросов математически различны, потому что они требуют разного уровня информации, на которую нужно ответить (контрафакты нуждаются в большем количестве информации, чтобы ответить) и еще более сложного языка, который будет сформулирован !.
Имея информацию, необходимую для ответа на вопросы по заданию 3, вы можете ответить на вопросы по заданию 2, но не наоборот. Точнее, вы не можете отвечать на контрфактические вопросы только с помощью интервенционной информации. Примеры, где происходит столкновение вмешательств и подделок, уже были приведены здесь в резюме, см. Этот пост и этот пост . Однако для полноты картины я приведу здесь также пример.
Пример ниже можно найти в Причинности, раздел 1.4.4.
х = 1х = 0Y= 0Y= 1п( у| х)=0,5∀х,у
п( Y= 1 | do ( X= 1 ) ) - P( Y= 1 | do ( X= 0 ) = 0
п( Y0= 0 | Икс= 1 , Y= 1 )
На этот вопрос нельзя ответить только с помощью интервенционных данных, которые у вас есть. Доказательство простое: я могу создать две разные причинно-следственные модели, которые будут иметь одинаковые интервенционные распределения, но разные контрфактуальные распределения. Два приведены ниже:
Uп( у, Х )
Обратите внимание, что в первой модели лечение ни на кого не влияет, поэтому процент тех пациентов, которые умерли при лечении, которые могли бы выздороветь, если бы они не принимали лечение, равен нулю.
Однако во второй модели лечение оказывает влияние на каждого пациента, и мы имеем смесь двух групп населения, в которых средний причинный эффект оказывается равным нулю. В этом примере контрфактическое количество теперь достигает 100% - в модели 2 все пациенты, которые умерли под лечением, выздоровели бы, если бы не принимали лечение.
Таким образом, есть четкое различие между ступенью 2 и ступенью 3. Как показывает пример, вы не можете ответить на контрфактические вопросы только с помощью информации и предположений о вмешательствах. Это становится понятным с помощью трех шагов для вычисления контрфактуальности:
- п( и )п( и | е )
- dо ( х ) )
- Y
Это будет невозможно вычислить без некоторой функциональной информации о причинной модели или без некоторой информации о скрытых переменных.