Действие соответствует вмешательству в переменную X, которое устанавливает его в значение xdо ( х )ИксИкс . Когда мы вмешиваемся в , это означает, что родители X больше не влияют на его значение, что соответствует удалению стрелок, указывающих на X. Итак, давайте представим это вмешательство в новом DAG.ИксИксИкс
Назовем исходное распределение наблюдений и распределение после вмешательства P ∗ . Наша цель состоит в том, чтобы выразить Р * в терминах P . Обратите внимание , что в Р * мы имеем , что U ⊥ X . Кроме того, вероятности до вмешательства и после вмешательства разделяют эти две инвариантности: P ∗ ( U ) = P ( U ) и P ∗ ( Y | X , U ) = P ( Y |пп*P∗PP∗U⊥XP∗(U)=P(U) поскольку мы не касались стрелок, вводящих эти переменные в нашем вмешательстве. Так:P∗(Y|X,U)=P(Y|X,U)
P(Y|do(X)):=P∗(Y|X)=∑UP∗(Y|X,U)P∗(U|X)=∑UP∗(Y|X,U)P∗(U)=∑UP(Y|X,U)P(U)
XZ
P(Z|do(X))=P(Z|X)
P(Y|do(X))XZY
P(Y|do(Z))=∑X′P(Y|X′,Z)P(X′)
Где я использую штрих для удобства обозначения следующего выражения. Таким образом, эти два выражения уже относятся к распределению перед вмешательством, и мы просто использовали предыдущее обоснование бэкдора для их получения.
XYZYXZP(Y|Z,do(X))=P(Y|do(Z),do(X))=P(Y|do(Z))XYZZYX
P(Y|do(X))=∑ZP(Y|Z,do(X))P(Z|do(X))=∑ZP(Y|do(Z))P(Z|do(X))=∑Z∑X′P(Y|X′,Z)P(X′)P(Z|X)=∑ZP(Z|X)∑X′P(Y|X′,Z)P(X′)
∑ZP(Y|do(Z))P(Z|do(X))ZYP(Y|do(Z))XZXP(Z|do(X))
Следовательно, две корректировки дают вам такое же распределение после вмешательства на этом графике, как мы показали.
Перечитывая ваш вопрос, я подумал, что вас может заинтересовать прямая демонстрация того, что правая часть двух уравнений одинакова в распределении до вмешательства (которым они должны быть, учитывая наш предыдущий вывод). Это не сложно показать напрямую. Достаточно показать, что в вашем DAG:
∑X′P(Y|Z,X′)P(X′)=∑UP(Y|Z,U)P(U)
Y⊥X|U,ZU⊥Z|X
∑X′P(Y|Z,X′)P(X′)=∑X′(∑UP(Y|Z,X′,U)P(U|Z,X′))P(X′)=∑X′(∑UP(Y|Z,U)P(U|X′))P(X′)=∑UP(Y|Z,U)∑X′P(U|X′)P(X′)=∑UP(Y|Z,U)P(U)
Следовательно:
∑ZP(Z|X)∑X′P(Y|X′,Z)P(X′)=∑ZP(Z|X)∑UP(Y|Z,U)P(U)=∑UP(U)∑ZP(Y|Z,U)P(Z|X)=∑UP(U)∑ZP(Y|Z,X,U)P(Z|X,U)=∑UP(Y|X,U)P(U)