Статистика и причинный вывод?


51

В своей статье 1984 года «Статистика и причинно-следственные связи» Пол Холланд поднял один из самых фундаментальных вопросов статистики:

Что статистическая модель может сказать о причинно-следственной связи?

Это привело к его девизу:

НЕТ ПРИЧИНЫ БЕЗ МАНИПУЛЯЦИИ

который подчеркнул важность ограничений вокруг экспериментов, которые рассматривают причинно-следственную связь. Эндрю Гельман делает подобное замечание :

«Чтобы выяснить, что происходит, когда вы что-то меняете, необходимо это изменить.» ... Есть некоторые вещи, которые вы узнаете из нарушения системы, которые вы никогда не обнаружите при пассивном наблюдении.

Его идеи обобщены в этой статье .

Какие соображения следует учитывать при создании причинного следствия из статистической модели?


2
большой вопрос: см. также этот связанный вопрос о корреляции и причинно-следственной связи stats.stackexchange.com/questions/534/…
Jeromy Anglim


5
Чтобы много сказать. Но вы можете прочитать книгу Перла "Причинность" (2002, но более новое 2-е издание) или книгу Эрнана и Робинса "Причинный вывод" (2015, бесплатный электронный черновик онлайн, если вы ищете).

Ответы:


28

Это широкий вопрос, но учитывая, что цитата «Коробка, Охотник и Охотник» верна, я думаю, что это сводится к

  1. Качество экспериментального дизайна:

    • рандомизация, размеры выборки, контроль нарушителей, ...
  2. Качество выполнения дизайна:

    • соблюдение протокола, ошибка измерения, обработка данных, ...
  3. Качество модели точно отражает дизайн:

    • точно представлены блокирующие структуры, соответствующие степени свободы связаны с эффектами, оценки объективны, ...

Рискуя очевидным, я постараюсь выделить ключевые моменты каждого из них:

  1. Это большое подразделение статистики, но в его основной форме, я думаю, все сводится к тому, что, делая причинный вывод, мы в идеале начинаем с идентичных единиц, которые отслеживаются в идентичных средах, отличных от назначения для обработки. Любые систематические различия между группами после назначения логически связаны с лечением (мы можем определить причину). Но мир не так хорош, и единицы отличаются до обработки, а условия окружающей среды во время экспериментов не полностью контролируются. Таким образом, мы «контролируем то, что можем, и рандомизируем то, что не можем», что помогает гарантировать отсутствие систематического смещения из-за факторов, которые мы контролировали или рандомизировали. Одна из проблем заключается в том, что эксперименты, как правило, являются трудными (невозможными) и дорогостоящими, и было разработано большое разнообразие конструкций для эффективного извлечения как можно большего количества информации при максимально тщательном контроле обстановки, насколько это возможно, с учетом затрат. Некоторые из них являются довольно строгими (например, в медицине - двойное слепое, рандомизированное, плацебо-контролируемое исследование), а другие - менее (например, различные формы «квазиэкспериментов»).

  2. это также большая проблема, о которой статистики обычно не думают ... хотя мы должны. В прикладной статистической работе я могу вспомнить случаи, когда «эффекты», обнаруженные в данных, были ложными результатами несогласованности сбора или обработки данных. Мне также интересно, как часто информация об истинных причинных эффектах интереса теряется из-за этих проблем (я полагаю, что студенты прикладных наук, как правило, практически не обучаются тому, как данные могут быть искажены, - но я здесь не по теме ...)

  3. это еще один большой технический предмет и еще один необходимый шаг в объективном причинно-следственной связи. В определенной степени об этом позаботились, потому что толпа дизайнеров разрабатывает проекты и модели вместе (поскольку вывод из модели является целью, атрибуты оценки определяют дизайн). Но это доходит только до нас, потому что в «реальном мире» мы в конечном итоге анализируем экспериментальные данные из проектов, не относящихся к учебникам, а затем мы должны серьезно задуматься о таких вещах, как соответствующие элементы управления и то, как они должны войти в модель, и какие связанные степени свобода должна быть, и будут ли выполнены предположения, если, если нет, как скорректировать нарушения и насколько обоснованы оценки для любых оставшихся нарушений и ...

Во всяком случае, надеюсь, что некоторые из вышеперечисленных помогают размышлять о соображениях при создании причинно-следственного вывода из модели. Я забыл что-нибудь большое?


3
Огромный плюс за пункт 2. Помимо прохождения обучения по защите человека, я никогда не получал ни малейшего обучения по сбору и хранению данных. Правильный сбор данных намного важнее анализа.
Мэтт Паркер

Я бы тоже хотел ответить, но боюсь, что нечего добавить к тому, что сказал Кингсфорд.
Йорис Мейс

7

В дополнение к превосходному ответу выше, есть статистический метод, который может приблизить вас к демонстрации причинности. Именно причинно-следственная связь Грейнджера демонстрирует, что одна независимая переменная, существующая до того, как зависимая переменная имеет причинный эффект или нет. Я представляю этот метод в легкой для ознакомления презентации по следующей ссылке:

http://www.slideshare.net/gaetanlion/granger-causality-presentation

Я также применяю этот метод для тестирования конкурирующих макроэкономических теорий: http://www.slideshare.net/gaetanlion/economic-theory-testing-presentation

Имейте в виду, что этот метод не идеален. Это просто подтверждает, что некоторые события происходят раньше других, и что эти события, похоже, имеют последовательную направленную связь. Кажется, это влечет за собой истинную причинность, но это не всегда так. Утренний звонок петуха не вызывает восхода солнца.


4

Что статистическая модель может сказать о причинно-следственной связи? Какие соображения следует учитывать при создании причинного следствия из статистической модели?

Первое, что нужно прояснить, это то, что вы не можете сделать причинный вывод из чисто статистической модели. Ни одна статистическая модель не может ничего сказать о причинности без причинных предположений. То есть, чтобы сделать причинный вывод, вам нужна причинная модель .

Даже в чем-то, что считается золотым стандартом, например, в рандомизированных контрольных испытаниях (РКИ), вам необходимо сделать причинные предположения, чтобы продолжить. Позвольте мне прояснить это. Например, предположим, что - это процедура рандомизации, - интересующая обработка, а - интересующий результат. Предполагая идеальное РКИ, вы предполагаете следующее:ZXY

введите описание изображения здесь

В этом случае поэтому все работает хорошо. Однако предположим, что у вас есть несовершенное соответствие полученного в проклятых связях между и . Тогда, теперь, ваш RCT выглядит так:P(Y|do(X))=P(Y|X)XY

введите описание изображения здесь

Вы все еще можете сделать намерение лечить анализ. Но если вы хотите оценить реальный эффект от все уже не просто. Это инструментальная настройка переменной, и вы можете иметь возможность связать или даже указать идентификацию эффекта, если сделаете некоторые параметрические предположения .X

Это может стать еще сложнее. У вас могут быть проблемы с ошибкой измерения, субъекты могут отказаться от исследования или не следовать инструкциям, в том числе. Вам нужно будет сделать предположения о том, как эти вещи связаны с выводом. С «чисто» данными наблюдений это может быть более проблематично, потому что обычно исследователи не имеют четкого представления о процессе генерации данных.

Следовательно, чтобы сделать причинные выводы из моделей, вам нужно судить не только о его статистических предположениях, но, что наиболее важно, о его причинных предположениях. Вот некоторые распространенные угрозы для причинного анализа:

  • Неполные / неточные данные
  • Целевое причинное количество интереса недостаточно точно определено (какой причинный эффект вы хотите определить? Какова целевая группа?)
  • Смущение (ненаблюдаемые нарушители)
  • Смещение выбора (самоотбор, усеченные образцы)
  • Ошибка измерения (которая может вызывать не только шум, но и смешивание)
  • Неправильная спецификация (например, неправильная функциональная форма)
  • Проблемы внешней достоверности (неправильный вывод на целевую группу)

Иногда утверждение об отсутствии этих проблем (или утверждение об их решении) может быть подкреплено дизайном самого исследования. Вот почему экспериментальные данные обычно более достоверны. Иногда, однако, люди отберут эти проблемы либо с помощью теории, либо для удобства. Если теория мягкая (как в социальных науках), будет труднее принять выводы за чистую монету.

Каждый раз, когда вы думаете, что есть предположение, которое не может быть подтверждено, вы должны оценить, насколько чувствительны выводы к вероятным нарушениям этих предположений - это обычно называется анализом чувствительности.


Было бы эквивалентно заменить пунктирную двунаправленную стрелку двумя однонаправленными сплошными стрелками из дополнительного узла?
Тейлор

@ Тейлор да, скрытый (ненаблюдаемый) дополнительный узел.
Карлос Синелли
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.