Представление эффектов взаимодействия в ориентированных ациклических графах


17

Направленные ациклические графы (DAG; например, Greenland, et al, 1999) являются частью формализма причинно-следственной связи из контрфактуальной интерпретации причинно-следственной связи. На этих графиках наличие стрелки от переменной A к переменной В утверждает, что переменная A непосредственно вызывает (некоторое изменение в риске) переменную В , а отсутствие такой стрелки утверждает, что переменная A не вызывает непосредственно (некоторое изменение в риске) из) переменной В .

В качестве примера, утверждение «воздействие табачного дыма непосредственно вызывает изменение риска мезотелиомы» представлено черной стрелкой от «воздействия табачного дыма» до «мезотелиомы» на диаграмме причинно-следственной связи DAG ниже.

Аналогичным образом, утверждение «воздействие асбеста напрямую вызывает изменение риска мезотелиомы» представлено черной стрелкой от «воздействия асбеста» до «мезотелиомы» на диаграмме причин не DAG ниже.

Я использую термин не DAG, чтобы описать приведенный ниже причинный график из-за красной стрелки, которую я намерен утверждать, что-то вроде «воздействие асбеста вызывает изменение в прямом причинном влиянии воздействия табачного дыма на риск мезотелиомы» (асбест делает физическое повреждение клеток легкого, которое, помимо непосредственного изменения риска мезотелиомы, также делает клетки более восприимчивыми к канцерогенному вреду от воздействия табачного дыма, в результате чего воздействие асбеста и табака приводит к увеличению риск, который больше, чем сумма двух отдельных рисков), и это не совсем соответствует формальному значению причинных стрелок в группах обеспечения доступности баз данных, которые я описал в начале моего вопроса (т. е. потому что красная стрелка не заканчивается в переменной).

Не направленный ациклический график: воздействие табачного дыма увеличивает риск мезотелиомы;  воздействие асбеста вызывает повышенный риск мезотелиомы;  Воздействие асбеста вызывает увеличение причинного влияния табака на риск мезотелиомы.

Как правильно представить эффекты взаимодействия в визуальном формализме DAG?

Ссылки

Гренландия С., Перл Дж. И Робинс Дж. М. (1999). Причинно-следственные диаграммы для эпидемиологических исследований . Эпидемиология , 10 (1): 37–48.


Можно ли изменить DAG, добавив узел для повреждения клеток легкого со стрелками от табака и асбеста и стрелкой для мезотелиомы? Это сохраняет DAG и обеспечивает гибкость для моделирования индивидуальных и сложных эффектов.
Джон Вульф

Да, я думал о чем-то подобном, но мне интересно, подразумевает ли это, что основной эффект табака - это также не «повреждение клеток легких», когда это так. Я полагаю, можно добавить еще одну переменную «табак и асбест вместе», вызванную табаком и асбестом, но это кажется неуклюжим ... но, возможно, это то, с чем нужно идти.
Алексис

Какое программное обеспечение вы использовали для создания графика?
zipzapboing

@zipzapboing нарисовал его вручную в MS Word, или PageStream, или Scribus, или что-то еще, затем отредактировал для цвета и прозрачности, используя GIMP. (На самом деле это отрывок из некоторых моих слайдов с лекциями.)
Алексис

Ответы:


9

Теория причинности Перла совершенно непараметрическая . Из-за этого взаимодействия не делаются явными ни на графике, ни в структурных уравнениях, которые он представляет. Тем не менее, причинные эффекты могут варьироваться (дико) в зависимости от предположения.

Если эффект идентифицирован и вы оцениваете его по данным непараметрически, вы получаете полное распределение причинных эффектов (вместо, скажем, одного параметра). Соответственно, вы можете непараметрически оценить причинный эффект воздействия табака на воздействие асбеста, чтобы увидеть, изменяется ли он без какой-либо функциональной формы.

Давайте посмотрим на структурные уравнения в вашем случае, которые соответствуют вашему «DAG» без красной стрелки:

е1εм

е2εT

е3εa

ε

Мы оставили соответствующие функции f () и распределения ошибок неопределенными, за исключением того, что последние независимы. Тем не менее, мы можем применить теорию Перла и сразу заявить, что выявлены причинные эффекты воздействия табака и асбеста на мезотелиому . Это означает, что, если бы у нас было бесконечно много наблюдений от этого процесса, мы могли бы точно измерить эффект от установки воздействий на разные уровни, просто наблюдая случаи мезотелиомы у людей с различными уровнями воздействия. Таким образом, мы можем сделать вывод о причинно-следственной связи, не проводя настоящий эксперимент. Это связано с тем, что не существует задних путей от переменных воздействия к исходной переменной.

Таким образом, вы получите

P (мезотелиома | до (табак = т)) = P (мезотелиома | табак = т)

Та же логика применима к причинному эффекту асбеста, который позволяет просто оценить:

P (мезотелиома | табак = t, асбест = а) - P (мезотелиома | табак = t, асбест = а)

в сравнении с

P (мезотелиома | табак = t, асбест = a ') - P (мезотелиома | табак = t', асбест = a ')

для всех соответствующих значений t и а, чтобы оценить эффекты взаимодействия.

В вашем конкретном примере давайте предположим, что исходная переменная является переменной Бернулли - у вас может быть мезотелиома или нет - и что человек подвергался воздействию очень высокого уровня асбеста а. Тогда очень вероятно, что он будет страдать от мезотелиомы; соответственно, эффект от увеличения воздействия табака будет очень низким. С другой стороны, если уровни асбеста а 'очень низкие, увеличение воздействия табака будет иметь больший эффект. Это будет представлять собой взаимодействие между воздействием табака и асбеста.

Конечно, непараметрическая оценка может быть чрезвычайно сложной и шумной с конечными данными и множеством различных значений t и a, поэтому вы можете подумать о предположении некоторой структуры в f (). Но в принципе вы можете сделать это без этого.


Джулиан, спасибо за углубленную логику контрафактной причинности Перл. Ваш ответ был бы улучшен, если бы я обратился к визуальному представлению эффектов взаимодействия, которое было центральным в моем вопросе (возможно, сказав, что «группы обеспечения доступности баз данных не делают эффекты взаимодействия явными» или что у вас получилось)
Алексис

1
Да ты прав; Я пытался прояснить это в самом начале.
Джулиан Шусслер

Джулиан, это здорово. Вы говорите, что строительные блоки DAG - это не отдельные ссылки, C = f (D), а в более общем смысле наборы ссылок, C = f (D, E, ...). Моя проблема в том, что Жемчужина иногда неопределенна в этом, например, в «Причинности» его Def 2.2.1 .: «Причинная структура набора переменных V - это DAG, в которой каждый узел соответствует отдельному элементу V, а каждый ссылка представляет собой прямую функциональную связь между соответствующими переменными. " Конечно, отдельные ссылки родителей C на C ничего не значат сами по себе, они только показывают участие в коллективном влиянии на C. Вы согласны?
Стив Пауэлл

Да. C = f (D, E) будет показано двумя ссылками на графике от D / E до C. Интерпретация ссылок состоит в том, что D и E определяют C. Таким образом, ссылки, конечно, являются реляционными.
Джулиан Шуесслер

10

Простой ответ заключается в том, что вы уже делаете. Обычные DAG представляют не только основные эффекты, но и комбинацию основных эффектов и взаимодействий. После того, как вы нарисовали свою группу обеспечения доступности баз данных, вы уже предполагаете, что любые переменные, указывающие на один и тот же результат, могут изменить эффект других, указывающих на тот же результат. Это допущение моделирования, отдельное от DAG, которое предполагает отсутствие взаимодействия.

Кроме того, взаимодействие может происходить без включения в вашу модель явного термина взаимодействия. Если вы включите основные эффекты только в модель для отношения риска Y по отношению к лечению T и ковариате Q, оценка разницы риска будет отличаться в зависимости от уровня Q. Чтобы учесть все эти возможности непараметрически, группы обеспечения доступности баз данных делают только самые слабые предположения о функциональной форме отношений между переменными, а также предположения об отсутствии взаимодействия, являются более сильным предположением, допускающим взаимодействие. Это еще раз говорит о том, что группы доступности баз данных уже позволяют взаимодействовать без какой-либо корректировки. См. Vanderweele (2009) для обсуждения взаимодействия, которое использует обычные группы доступности баз данных, но допускает взаимодействие.

Bollen & Paxton (1998) и Muthén & Asparouhov (2015) оба демонстрируют взаимодействия в моделях путей со скрытыми переменными, но эти взаимодействия явно относятся к терминам продукта в параметрической модели, а не к взаимодействиям в целом. Я также видел диаграммы, подобные вашей, где причинная стрелка указывает на путь, но, строго говоря, путь не является уникальной величиной, на которую переменная может оказать причинное влияние (даже если это может быть то, как мы хотим интерпретировать наши модели) ; он просто представляет наличие причинного эффекта, а не его величину.


Боллен К.А. и Пакстон П. (1998). Взаимодействие скрытых переменных в моделях структурных уравнений. Моделирование структурных уравнений: междисциплинарный журнал, 5 (3), 267-293.

Muthén, B. & Asparouhov, T. (2015). Скрытые переменные взаимодействия.

VanderWeele, TJ (2009). О разнице между взаимодействием и модификацией эффекта. Эпидемиология, 20 (6), 863-871.


3
Также: «После того, как вы нарисовали свой DAG, вы уже предполагаете, что любые переменные, указывающие на один и тот же результат, могут изменить эффект других, указывающих на тот же результат. Это предположение моделирования, отдельное от DAG, которое предполагает отсутствие взаимодействие ". является блестящим ... это действительно помогло эти идеи земли со мной.
Алексис
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.