Вероятностный Структурная Причинно Модель (SCM) определяется как кортеж , где U представляет собой набор экзогенных переменных, V множество эндогенных переменных, F представляет собой набор структурных уравнений что определяет значения каждой эндогенной переменной и P ( U ) распределения вероятностей по области U .M=⟨U,V,F,P(U)⟩UVFP(U)U
В СКМ мы представляем эффект вмешательства на переменную с помощью подмодели М х = ⟨ U , V , Р х , Р ( У ) ⟩ , где Р х указывает на то, что структурное уравнение для X заменяется новым интервенционной уравнения , Например, атомарное вмешательство установки переменной X в определенное значение x --- обычно обозначаемое d o ( X = x ) --- состоит в замене уравнения для XXMx=⟨U,V,Fx,P(U)⟩FxXXxdo(X=x)Xс уравнением .X=x
Чтобы прояснить идеи, представьте непараметрическую структурную причинную модель определяемую следующими структурными уравнениями:M
Z=UzX=f(Z,Ux)Y=g(X,Z,Uy)
Где возмущения имеют некоторое распределение вероятностей P ( U ) . Это вызывает распределение вероятностей по эндогенным переменным P M ( Y , Z , X ) и, в частности, условное распределение Y с учетом X , P M ( Y | X ) .UP(U)PM(Y,Z,X)YXPM(Y|X)
Но обратите внимание : является «наблюдательным» распределение Y данного X в контексте модели М . Что повлияет на распределение Y, если мы вмешаемся в X, установив его в x ? Это не более чем распределение вероятностей Y, вызванное модифицированной моделью M x :PM(Y|X)YXMYXxYMx
Z=UzX=xY=g(X,Z,Uy)
То есть интервенционная вероятность если мы установим X = x , определяется вероятностью, индуцированной в подмодели M x , то есть P M x ( Y | X = x ), и обычно она обозначается P ( Y | d o). ( Х = х ) ) . Оператор d o ( X = x ) дает понять, что мы вычисляем вероятность YYX=xMxPMx(Y|X=x)P(Y|do(X=x))do(X=x)Yв подмодели, где существует интервальная настройка равная x , что соответствует переопределению структурного уравнения X уравнением X = x .XxXX=x
Цель многих анализов состоит в том, чтобы найти, как выразить интервенционное распределение в терминах общей вероятности наблюдательного (предварительного вмешательства) распределения.P(Y|do(X))
делать-исчисление
Делать-исчисление это не то же самое, что и оператора. Делать-исчисление состоит из трех правил вывода для помощи «массажа» распределения вероятностей после вмешательства и получить P ( Y | d о ( X ) ) с точки зрения наблюдений распределения (до вмешательства). Следовательно, вместо выполнения дериваций вручную, например, в этом вопросе, вы можете позволить алгоритму выполнить деривации и автоматически дать вам непараметрическое выражение для идентификации интересующего вас причинного запроса (do(⋅)P(Y|do(X))и do-исчисление завершено для рекурсивных непараметрических структурно-причинных моделей ).