Книга Почему Иудеи Перл: Почему он избивает статистику?


79

Я читаю Книгу Почему Иудеи Перл, и она становится у меня под кожей 1 . В частности, мне кажется, что он безоговорочно избивает «классическую» статистику, выдвигая аргумент, что статистика никогда не сможет исследовать причинно-следственные связи, никогда не будет интересоваться причинно-следственными связями и что статистика «стала моделью предприятие по сокращению данных ". Статистика становится уродливым s-словом в его книге.

Например:

Статистики были очень смущены тем, какие переменные должны и не должны контролироваться, поэтому по умолчанию практикуется контроль всего, что можно измерить. [...] Это удобная и простая процедура, но она расточительна и содержит ошибки. Ключевым достижением Причинной революции было положить конец этой путанице.

В то же время статистики сильно недооценивают контроль в том смысле, что им не хочется говорить о причинности вообще [...]

Тем не менее, причинно-следственные модели были в статистике, как, навсегда. Я имею в виду, что регрессионная модель может использоваться по существу как причинно-следственная модель, поскольку мы по существу предполагаем, что одна переменная является причиной, а другая - следствием (следовательно, корреляция отличается от подхода регрессионного моделирования), и проверяем, объясняет ли это причинно-следственная связь наблюдаемые закономерности. ,

Другая цитата:

Неудивительно, что статистики, в частности, сочли эту головоломку [проблему Монти Холла] трудной для понимания. Они привыкли, как выразился Р. А. Фишер (1922), к «сокращению данных» и игнорированию процесса генерации данных.

Это напоминает мне ответ Эндрю Гельмана на знаменитый карикатуру xkcd о байесовских и частых людях: «Тем не менее, я думаю, что мультфильм в целом несправедлив в том смысле, что он сравнивает разумного байесовского статистика с частыми статистами, который слепо следует совету мелких учебников. «.

Количество искаженного представления s-слова, которое, как я понимаю, существует в книге Иудеи Перлз, заставило меня задуматься о том, сомнительна ли причинная связь (которую я до сих пор воспринимал как полезный и интересный способ организации и проверки научной гипотезы 2 ).

Вопросы: вы думаете, что Иудея Перл искажает статистику, и если да, то почему? Просто чтобы причинный вывод звучал больше, чем он есть? Вы думаете, что причинный вывод - это Революция с большим R, которая действительно меняет все наше мышление?

Редактировать:

Приведенные выше вопросы являются моей основной проблемой, но, поскольку они, по общему признанию, являются самоуверенными, пожалуйста, ответьте на эти конкретные вопросы (1) в чем смысл «причинной революции»? (2) чем она отличается от "ортодоксальной" статистики?

1. Кроме того, потому что он такой скромный парень.
2. Я имею в виду в научном, а не статистическом смысле.

РЕДАКТИРОВАТЬ : Эндрю Гельман написал это сообщение в блоге на книгу Иудеи Перлз, и я думаю, что он сделал гораздо лучше, объясняя мои проблемы с этой книгой, чем я. Вот две цитаты:

На странице 66 книги Перл и Маккензи пишут, что статистика «превратилась в предприятие по сокращению данных, которое не использует модели». Эй! Какого черта ты несешь?? Я статистик, я занимаюсь статистикой в ​​течение 30 лет, работаю в областях от политики до токсикологии. «Слепое моделирование данных»? Это просто фигня. Мы постоянно используем модели.

И еще один:

Смотреть. Я знаю о дилемме плюрализма. С одной стороны, Перл считает, что его методы лучше, чем все, что было раньше. Хорошо. Для него и многих других они являются лучшими инструментами для изучения причинно-следственных связей. В то же время, как плюралист или студент, изучающий историю, мы понимаем, что существует много способов испечь торт. Трудно проявлять уважение к подходам, которые на самом деле не работают для вас, и в какой-то момент единственный способ сделать это - сделать шаг назад и осознать, что реальные люди используют эти методы для решения реальных проблем. Например, я думаю, что принятие решений с использованием p-значений - ужасная и логически несвязная идея, которая привела к множеству научных катастроф; в то же время многим ученым удается использовать p-значения в качестве инструментов для обучения. Я признаю это. По аналогии, Я бы порекомендовал Перлу признать, что аппарат статистики, иерархического регрессионного моделирования, взаимодействия, посттратификации, машинного обучения и т. Д. И т. Д. Решает реальные проблемы в причинно-следственной связи. Наши методы, как и у Перла, также могут испортить - GIGO! - и, возможно, Перл прав, что нам всем было бы лучше перейти на его подход. Но я не думаю, что это помогает, когда он дает неточные заявления о том, что мы делаем.


41
Линейная регрессия не является причинно-следственной моделью. Простая линейная регрессия такая же, как и парная корреляция, единственное отличие - стандартизация . Таким образом, если вы говорите, что регрессия является причинной, то то же самое должно быть верно и для корреляции. Является ли причинно-следственная связь? Вы можете использовать регрессию, чтобы предсказать любые бессмысленные отношения между любыми произвольными переменными (со многими «значительными» результатами случайно).
Тим

8
Разногласия по поводу того, какой подход к рассуждениям о причинно-следственной связи в статистике имеет наибольшую ценность между Перлом, Рубином, Хекманом и другими, похоже, утратили популярность, и я думаю, что тон Перл становится все более надменным. Не позволяйте этому отвлекать вас от подлинного понимания, которое он может предложить. Прочтите его раннюю книгу «Причинность», она меньше попадет под вашу кожу.
CloseToC

7
@CloseToC Я хотел бы добавить, что Перл, Рубин и Хекман в некотором роде работают в одной и той же среде (т. Е. Логически эквивалентных платформах, см. Здесь stats.stackexchange.com/questions/249767/… ), поэтому их споры находятся в другом уровень от обсуждения таких вещей, как «линейная регрессия является причинно-следственной моделью».
Карлос Синелли

9
Я сам был раздражен этой книгой. Там есть некоторые просто ложные статистические утверждения (не могу сейчас привести, книга с моими пометками на полях дома), что заставило меня задуматься, был ли плохой статистик только журналист, который помогал Перл написать книгу, или же сам Перл. (Само собой разумеется, я был очень удивлен, обнаружив такие вопиющие ошибки в работе такого уважаемого ученого.) Его бумаги намного лучше, хотя даже там никто не будет обвинять Перл в скромности ...
Ричард Харди

15
У меня есть некоторое беспокойство, что эта нить уже связывает воедино (а) конкретную книгу от очень умного человека (б) личность и стиль умного человека (в), является ли конкретная точка зрения правильной, преувеличенной или какой-либо другой.
Ник Кокс

Ответы:


59

Я полностью согласен с тем, что тон Перла высокомерен, а его характеристика "статистиков" - упрощенная и монолитная. Кроме того, я не нахожу его написание особенно ясным.

Тем не менее, я думаю, что он имеет смысл.

Причинно-следственные рассуждения не были частью моего формального обучения (MSc): ближе всего к теме я выбрал факультативный курс по экспериментальному дизайну, то есть любые претензии по причинно-следственной связи требовали от меня физического контроля окружающей среды. Книга Перла « Причинность» была моим первым знакомством с опровержением этой идеи. Очевидно, что я не могу говорить за всех статистиков и учебных программ, но с моей собственной точки зрения я согласен с замечанием Перл о том, что причинно-следственная аргументация не является приоритетом в статистике.

Это правда, что статистики иногда контролируют больше переменных, чем это строго необходимо, но это редко приводит к ошибке (по крайней мере, по моему опыту).

Это также убеждение, которое я придерживался после получения степени магистра в области статистики в 2010 году.

Однако это глубоко неверно. Когда вы контролируете общий эффект (называемый в книге «коллайдер»), вы можете ввести смещение выбора. Это осознание было для меня поразительным и действительно убедило меня в полезности представления моих причинных гипотез в виде графиков.

РЕДАКТИРОВАТЬ: меня попросили уточнить выбор предвзятости. Эта тема довольно тонкая, я настоятельно рекомендую просмотреть edX MOOC на Причинных Диаграммах , очень хорошее введение в графики, в котором есть глава, посвященная смещению выбора.

Например, перефразируя эту статью, приведенную в книге: рассмотрим переменные A = привлекательность, B = красота, C = компетентность. Предположим, что В и С причинно не связаны в общей популяции (т. Е. Красота не вызывает компетентности, компетентность не вызывает красоты, а красота и компетентность не имеют общей причины). Предположим также, что любой из B или C является достаточным для того, чтобы быть привлекательным, то есть A является коллайдером. Обусловливание на А создает ложную связь между В и С.

Более серьезным примером является «парадокс веса при рождении», согласно которому курение матери (S) во время беременности, по-видимому, снижает смертность (M) ребенка, если ребенок имеет недостаточный вес (U). Предложенное объяснение состоит в том, что врожденные дефекты (D) также вызывают низкий вес при рождении, а также способствуют смертности. Соответствующей причинной диаграммой является {S -> U, D -> U, U -> M, S -> M, D -> M}, в которой U является коллайдером; обусловливание этого вводит ложную ассоциацию. Интуиция в этом заключается в том, что, если мать курильщик, низкая масса тела при рождении менее вероятна из-за дефекта.


8
+1. Не могли бы вы подробнее рассказать о том, как это вносит предвзятость выбора? Возможно, небольшой конкретный пример прояснит это для большинства читателей.
говорит амеба: восстанови Монику

2
Спасибо за редактирование. Это очень четкие примеры.
говорит амеба: восстанови Монику

Итак, интуиция для курильщиков с низким весом при рождении правильна, верно?
Malady

@Malandy: эта модель соответствует данным и имеет интуитивный смысл. Я не знаю, правильно ли это.
Митч


71

Ваш вопрос отражает то, что говорит Перл!

простая линейная регрессия по сути является причинно-следственной моделью

Нет, линейная регрессия - это статистическая модель, а не причинная модель. Предположим, что - случайные величины с многомерным нормальным распределением. Тогда вы можете правильно оценить линейные ожидания , , , т. Д., Используя линейную регрессию, но есть Здесь нет ничего, что говорит о том, являются ли какие-либо из этих величин причинными.Y,X,ZE[YX]E[XY]E[YX,Z]E[ZY,X]

Линейное структурное уравнение, с другой стороны, является причинной моделью. Но первым шагом является понимание разницы между статистическими допущениями (ограничения на наблюдаемое совместное распределение вероятностей) и причинно-следственными допущениями (ограничения на причинную модель).

Вы думаете, что Иудея Перл искажает статистику, и если да, то почему?

Нет, я так не думаю, потому что мы ежедневно видим эти заблуждения. Конечно, Перл делает некоторые обобщения, так как некоторые статистики работают с причинно-следственной связью (Дон Рубин был пионером в продвижении потенциальных результатов ... также, я статистик!). Но он прав, говоря, что основная часть традиционного образования в области статистики избегает причинности, даже чтобы формально определить, что такое причинный эффект.

Чтобы прояснить это, если мы попросим статистика / эконометрика с регулярным обучением математически определить, каково ожидаемое значение если мы вмешаемся в , он, вероятно, напишет (см. Пример здесь) ! Но это наблюдательная величина, это не то, как вы определяете причинный эффект! Другими словами, в настоящее время учащемуся, имеющему только традиционный курс статистики, не хватает даже способности правильно определить это количество математически ( или ), если вы не знакомы с структурная / контрфактивная теория причинности !YXE[Y|X] E [ Y x ] E [ Y | д о ( х ) ]E[Yx]E[Y|do(x)]

Цитата, которую вы привели из книги, также является отличным примером. В традиционных книгах по статистике вы не найдете правильного определения того, что является нарушителем, а также указаний о том, когда следует (или не следует) приспосабливаться к ковариации в наблюдательных исследованиях. В общем, вы видите «корреляционные критерии», такие как «если ковариата связана с лечением и с результатом, вы должны приспособиться к нему». Один из наиболее заметных примеров этой путаницы проявляется в «Парадоксе Симпсона» - когда сталкиваются с двумя оценками противоположных признаков, какой из них следует использовать, скорректированный или нескорректированный? Ответ, конечно, зависит от причинно-следственной модели.

И что имеет в виду Перл, когда говорит, что этот вопрос положен конец? В случае простой корректировки с помощью регрессии он ссылается на критерий черного хода (подробнее здесь) . И для идентификации в целом - помимо простой корректировки - он означает, что у нас теперь есть полные алгоритмы для идентификации причинных эффектов для любого данного полумарковского DAG.

Здесь стоит сделать еще одно замечание. Даже в экспериментальных исследованиях - где традиционная статистика, безусловно, проделала большую работу по разработке экспериментов! - в конце дня вам все еще нужна причинно-следственная модель . Эксперименты могут страдать от несоответствия, от потери контроля, от смещения выбора ... также, большую часть времени вы не хотите ограничивать результаты ваших экспериментов конкретной популяцией, которую вы проанализировали, вы хотите обобщить свои экспериментальные результаты для более широкой / другой популяции, Здесь, опять же, можно спросить: что вы должны отрегулировать? Достаточно ли у вас данных и существенных знаний для такой экстраполяции? Все это причинные понятия, поэтому вам нужен язык, чтобы формально выразить причинные предположения и проверить, достаточно ли их, чтобы позволить вам делать то, что вы хотите!

В целом, эти заблуждения широко распространены в статистике и эконометрике, здесь есть несколько примеров перекрестной проверки, таких как:

И многое другое

Вы думаете, что причинный вывод - это Революция с большим R, которая действительно меняет все наше мышление?

Учитывая текущее состояние дел во многих науках, насколько мы продвинулись и как быстро все меняется, и сколько мы еще можем сделать, я бы сказал, что это действительно революция.

PS : Перл предложил два своих поста в блоге причинности UCLA, которые будут интересны для этого обсуждения, вы можете найти посты здесь и здесь .

PS 2 : как Январь упомянул в своем новом издании, у Эндрю Гельмана есть новый пост в его блоге. В дополнение к дебатам в блоге Гельмана, Перл также ответил в твиттере (ниже):

Обзор Гельмана о #Bookofwhy должен быть интересен, потому что он представляет отношение, которое парализует широкие круги статистических исследователей. Моя первоначальная реакция теперь размещена на https://t.co/mRyDcgQtEc Похожие сообщения:https://t.co/xUwR6eCGrZ иhttps://t.co/qwqV3oyGUy

- Иудея Перл (@yudapearl) 9 января 2019 г.


4
Спасибо. Но, говоря проще, я могу вычислить E [X | Y] так же, как E [Y | X], но я могу написать X ← Y, а также X → Y в DAG. Так или иначе, я должен начать с научной гипотезы или модели. Моя гипотеза, моя модель - мой выбор. Сам факт того, что я могу что-то сделать, не означает, что я должен это делать.
Январь

3
@ Январь, это не означает, что вы должны это делать. Суть в том, чтобы иметь возможность четко сформулировать то, что вы хотите оценить (причинная оценка), точно сформулировать свои причинные предположения (прояснить различие между причинными и статистическими предположениями), проверить логическое значение этих причинных предположений и способность понять, достаточно ли ваших причинных предположений + данных для ответа на ваш запрос.
Карлос Синелли

3
@January что у вас есть наблюдательное исследование и хотите оценить причинное влияние на . Как вы решаете, какие ковариаты включить в вашу регрессию? YXY
Карлос Синелли

4
Я думаю так: не кажется совершенно несправедливым предполагать, что ваш средний статистик, хотя он, вероятно, хорошо разбирается в причинно-следственных связях из контролируемых экспериментов, и, конечно, не рискует путать корреляцию с причинно-следственной связью, может быть немного шатким в отношении причинно-следственных связей из наблюдений данные. Я беру последнее в качестве контекста цитаты (я не читал книгу), и некоторые читатели этого поста могут этого не заметить.
Scortchi - Восстановить Монику

5
@ Январь Короче говоря, «поправка на ковариаты» не обязательно означает, что вы устранили смещение в оценках причинно-следственных связей этих переменных.
Алексис

31

Я поклонник сочинений Иудеи, и я прочитал Причинность (любовь) и Книгу Почему (как).

Я не чувствую, что Иудея бьет статистику. Трудно слышать критику. Но что мы можем сказать о любом человеке или области, которая не подвергается критике? Они стремятся от величия к самоуспокоенности. Вы должны спросить: является ли критика правильной, необходимой, полезной и предлагает ли она альтернативы? Ответом на все это является решительное «Да».

Верный? Я рассмотрел и сотрудничал с несколькими десятками статей, в основном анализом данных наблюдений, и я редко чувствую, что существует достаточное обсуждение причинно-следственной связи. Подход «корректировки» включает в себя выбор переменных, потому что они были выбраны вручную из DD как «полезные», «релевантные», «важные» или другие глупости. 1

Нужен? Средства массовой информации наводнены кажущимися противоречивыми заявлениями о влиянии крупных воздействий на здоровье. Несоответствие с анализом данных привело к застою доказательств, из-за которых у нас не хватает полезной политики, процедур здравоохранения и рекомендаций для лучшей жизни.

Полезно? Комментарий Иудеи уместен и достаточно конкретен, чтобы сделать паузу. Это имеет непосредственное отношение к любому анализу данных, с которым может столкнуться любой статистик или эксперт по данным.

Предлагает ли это альтернативы? Да, на самом деле Иудея обсуждает возможность использования усовершенствованных статистических методов и даже то, как они сводятся к известным статистическим системам (таким как моделирование структурных уравнений) и их связь с регрессионными моделями). Все сводится к тому, чтобы требовать четкого изложения содержания знаний, которые определяли подход к моделированию.

Иудея не просто предлагает нам переопределить все статистические методы (например, регрессию). Скорее он говорит, что нам нужно принять некоторую причинную теорию для обоснования моделей.

1 жалоба здесь об использовании убедительных и неточных формулировок для обоснования того, что в конечном итоге является неправильным подходом к моделированию. Это может частично совпадать, но Перл ясно понимает цель причинно-следственной диаграммы (DAG) и то, как переменные могут быть классифицированы как «определяющие факторы».


3
Хороший ответ. Обратите внимание, что, будучи не статистиком, а служа связующим звеном между статистикой и биологией в течение многих лет, для меня любую критику статистиков действительно не так сложно услышать ;-) Однако вы действительно думаете, что «ортодоксальная статистика» не может справиться с причинностью? вообще, как Перл прямо заявляет?
Январь

4
@January а.е. contraire . Я думаю, что недостаток статистиков в принятии причинно-следственных связей в их анализах напрямую связан с их недостатком в понимании частых выводов. Это контрфактическое рассуждение, которого не хватает.
AdamO

4
+1 «The„подстройка“подход заключается в выборе переменных , потому что они были подобранный из DD как„полезный“„отношение“„важно“или другой нонсенс , фактически включающий формальные гипотезы о конкретных причинно - следственных связей между ними ( а - ля официальное использование DAG) . " Редактирование добавлено. :)
Алексис

Комментарии не для расширенного обсуждения; этот разговор был перенесен в чат .
Scortchi - Восстановить Монику

23

Я не читал эту книгу, поэтому могу судить только по конкретной цитате, которую вы даете. Однако даже на этом основании я согласен с вами, что это кажется крайне несправедливым по отношению к статистике. Я на самом деле думаю, что статистики всегда отлично справлялись со своей задачей, подчеркивая различие между статистическими ассоциациями (корреляция и т. Д.) И причинно-следственной связью, и предостерегая от их смешения. Действительно, по моему опыту, статистики, как правило, были основной профессиональной силой, борющейся против повсеместного смешения причины и корреляции. Совершенно неверно (и фактически клевета) утверждать, что статистики «... вообще не хотят говорить о причинности». Я могу понять, почему вы раздражены, читая такую ​​высокомерную чушь.

Я бы сказал, что это довольно распространено для не статистиковкоторые используют статистические модели, чтобы плохо понимать взаимосвязь между статистической ассоциацией и причинностью. Некоторые имеют хорошую научную подготовку в других областях, и в этом случае они также могут быть хорошо осведомлены об этой проблеме, но, безусловно, есть люди, использующие статистические модели, которые плохо разбираются в этих проблемах. Это верно во многих прикладных научных областях, где практики имеют базовую подготовку в области статистики, но не изучают ее на глубоком уровне. В этих случаях часто профессиональные статистики предупреждают других исследователей о различиях между этими концепциями и их правильными отношениями. Статистики часто являются ключевыми разработчиками РКИ и других экспериментов, связанных с контрольными элементами, используемыми для выявления причинно-следственных связей. Их часто вызывают, чтобы объяснить протоколы, такие как рандомизация, плацебо, и другие протоколы, которые используются, чтобы попытаться разорвать отношения с потенциально смешанными переменными. Это правда, что статистики иногда контролируют больше переменных, чем это строго необходимо, но это редко приводит к ошибке (по крайней мере, по моему опыту). Я думаю, что большинство статистиков знают о разнице междуПерепутывающие переменные и переменные коллайдера, когда они проводят регрессионный анализ с целью выявления причинно-следственных связей, и даже если они не всегда строят совершенные модели, представление о том, что они каким-то образом избегают рассмотрения причинности, просто смешно.

Я думаю, что Иудея Перл внесла ценный вклад в статистику своей работой по причинно-следственной связи, и я благодарен ему за этот замечательный вклад. Он построил и изучил некоторые очень полезные формализмы, которые помогают изолировать причинно-следственные связи, и его работа стала основой хорошего статистического образования. Я прочитал его книгу Причинностьв то время как я был аспирантом, и это на моей полке, и на полках многих других статистиков. Большая часть этого формализма перекликается с вещами, которые были интуитивно известны статистикам еще до того, как они были формализованы в алгебраическую систему, но в любом случае это очень ценно и выходит за рамки очевидного. (Я действительно думаю, что в будущем мы увидим слияние операции «do» с алгеброй вероятностей, происходящей на аксиоматическом уровне, и это, вероятно, в конечном итоге станет ядром теории вероятностей. Мне бы очень хотелось, чтобы это было встроено непосредственно в статистическое образование. , так что вы узнаете о причинно-следственных моделях и операции «делать», когда узнаете о вероятностных мерах.)

И последнее, что следует иметь в виду, заключается в том, что существует множество применений статистики, где цель является прогнозирующей , когда практикующий врач не стремится сделать вывод о причинно-следственной связи. Эти типы приложений чрезвычайно распространены в статистике, и в таких случаях важно не ограничивать себя причинно-следственными связями. Это верно в большинстве случаев применения статистики в финансах, управлении персоналом, моделировании рабочей силы и во многих других областях. Не следует недооценивать количество контекстов, в которых нельзя или не следует стремиться контролировать переменные.


Обновление: я замечаю, что мой ответ не совпадает с ответом, предоставленным Карлосом . Возможно, мы не согласны с тем, что представляет собой «статистика / эконометрик с регулярным обучением». Любой, кого я бы назвал «статистиком», обычно имеет, по крайней мере, дипломное образование и обычно имеет значительную профессиональную подготовку / опыт. (Например, в Австралии требование стать «аккредитованным статистиком» в нашем национальном профессиональном органе требует минимум четырехлетнего опыта работы после получения диплома с отличием или шестилетнего опыта работы после получения степени бакалавра.) В любом случае студент изучение статистики не статистика .

Я заметил, что в качестве доказательства предполагаемого непонимания причинности статистиками, ответ Карлоса указывает на несколько вопросов на CV.SE, в которых задается вопрос о причинности в регрессии. В каждом из этих случаев этот вопрос задается кем-то, кто, очевидно, является новичком (а не статистиком), а ответы, данные Карлосом и другими (которые отражают правильное объяснение), являются ответами с большим количеством голосов. Действительно, в некоторых случаях Карлос подробно рассказал о причинно-следственной связи, и его ответы получили наибольшее количество голосов. Это, безусловно, доказывает, что статистики понимают причинно-следственную связь .

Некоторые другие авторы отмечают, что анализ причинно-следственных связей часто не включается в учебную программу по статистике. Это правда, и это большой позор, но большинство профессиональных статистиков не являются недавними выпускниками, и они узнали гораздо больше, чем включено в стандартную магистерскую программу. Опять же, в этом отношении, похоже, у меня есть более высокий взгляд на средний уровень знаний статистиков, чем у других авторов.


12
Я не являюсь статистиком, чье официальное обучение в области статистики было проведено статистиками в той же области, и я преподаю и исследую статистику, использующую статистику. Я могу заверить вас, что принцип, в котором (например) корреляция не есть причинность, является и был повторяющейся мантрой в моей области. На самом деле я не сталкиваюсь с людьми, которые не видят, что корреляция между количеством осадков и урожайностью пшеницы - это еще не все, что нужно сказать о связи между ними и основными процессами. Обычно, по моему опыту, статистики тоже давно об этом думали.
Ник Кокс

8
Как эпидемиолог, я все больше и больше раздражаюсь этой мантрой. Как говорит @NickCox, это понимают даже не ученые. Проблема, которую я имею, состоит в том, когда все прыгают на побеждающую сторону на выборах "корреляции, не означает причинно-следственную связь!" всякий раз, когда публикуется обсервационное исследование (например, исследование «случай-контроль»). Да, корреляция не означает причинно-следственную связь, но исследователи, как правило, вполне осознают это и сделают все, чтобы спроектировать и проанализировать исследование таким образом, чтобы причинная интерпретация была по меньшей мере правдоподобной.
COOLSerdash

5
@ Ник Кокс: я отредактировал, чтобы более точно заявить, что есть много не статистиков, которые хорошо это понимают. У меня не было намерения разбрасываться по другим профессиям - я только подчеркивал, что этот вопрос очень хорошо понимают статистики.
Восстановите Монику

7
@NickCox Вклад Перла в причинно-следственную связь намного больше, чем «корреляция - это не причинность». Я здесь с Карлосом. Существует достаточно, чтобы узнать о причинности, чтобы это был целый курс. Насколько я знаю, большинство отделов статистики не предлагают такой курс.
Нил Г

12
@Ben: Перл не обвиняет статистиков в путанице корреляции и причинно-следственной связи. Он обвиняет их в том, что они избегают причинно-следственных связей. Я согласен с вами, что его тон высокомерен, но я думаю, что он имеет смысл.
Митч

11

простая линейная регрессия по сути является причинно-следственной моделью

Вот пример, который я привел, когда модель линейной регрессии не может быть причинно-следственной. Допустим, априори, что лекарство было принято в момент времени 0 ( t = 0 ) и что оно не влияет на частоту сердечных приступов в момент времени t = 1 . Сердечные приступы в момент времени t = 1 влияют на сердечные приступы в момент времени t = 2 (то есть предыдущие повреждения делают сердце более восприимчивым к повреждениям). Выживание в t = 3 зависит только от того, был ли у людей сердечный приступ в t = 2 - сердечный приступ в t = 1 реально затронул бы выживание в t = 3 , но у нас не будет стрелы ради простота.

Вот легенда:

DAG легенда

Вот истинный причинный график: уклон коллайдера

Давайте представим, что мы не знаем, что сердечные приступы в момент t = 1 не зависят от приема препарата в момент времени t = 0, поэтому мы строим простую модель линейной регрессии, чтобы оценить влияние препарата на сердечный приступ в момент времени t = 0 . Здесь нашим предиктором будет Drug t = 0, а нашей исходной переменной будет Heart Attack t = 1 . Единственные данные, которые у нас есть, - это люди, которые выживают при t = 3 , поэтому мы запустим нашу регрессию на этих данных.

Вот 95% байесовский вероятный интервал для коэффициента препарата t = 0 : 95% вероятный интервал, смещение коллайдера

Большая часть вероятности, как мы видим, больше 0, так что похоже, что эффект есть! Однако мы априори знаем, что эффект равен 0. Математика причинно-следственной связи, разработанная Иудеей Перл и другими, значительно упрощает понимание того, что в этом примере будет смещение (из-за обусловленности потомка коллайдера). Работа Иудеи подразумевает, что в этой ситуации мы должны использовать полный набор данных (то есть не смотреть на людей, которые только выжили), который удалит необъективные пути:

без предвзятости

Вот 95% Credible Interval, когда вы смотрите на полный набор данных (то есть не учитывает тех, кто выжил).

95% вероятный интервал, без смещения,

Он плотно отцентрирован в 0, что по существу не показывает никакой связи вообще.

В реальных примерах все может быть не так просто. Может быть много других переменных, которые могут вызывать систематическое смещение (смещение, смещение выбора и т. Д.). То, что нужно откорректировать в анализах, было математизировано Перлом; Алгоритмы могут подсказать, какую переменную нужно отрегулировать, или даже сообщить нам, что при корректировке недостаточно устранить систематическое смещение. Установив эту формальную теорию, нам не нужно тратить так много времени на споры о том, что нужно корректировать, а что - нет. мы можем быстро прийти к выводу о том, являются ли наши результаты надежными. Мы можем лучше спроектировать наши эксперименты, мы можем легче анализировать данные наблюдений.

Вот свободно доступный онлайн-курс о причинно-следственных связях, созданный Мигелем Эрнаном. В нем представлено множество примеров из жизни, в которых профессора / ученые / статистики пришли к противоположным выводам по данному вопросу. Некоторые из них могут показаться парадоксами. Тем не менее, вы можете легко решить их с помощью d-разделения Иудеи Перл и критерия черного хода .

Для справки приведем код процесса генерации данных и код достоверных интервалов, показанный выше:

import numpy as np
import pandas as pd
import statsmodels as sm
import pymc3 as pm
from sklearn.linear_model import LinearRegression

%matplotlib inline

# notice that taking the drug is independent of heart attack at time 1.
# heart_attack_time_1 doesn't "listen" to take_drug_t_0
take_drug_t_0 = np.random.binomial(n=1, p=0.7, size=10000)
heart_attack_time_1 = np.random.binomial(n=1, p=0.4, size=10000)

proba_heart_attack_time_2 = []

# heart_attack_time_1 increases the probability of heart_attack_time_2. Let's say
# it's because it weakens the heart and makes it more susceptible to further
# injuries
# 
# Yet, take_drug_t_0 decreases the probability of heart attacks happening at
# time 2
for drug_t_0, heart_attack_t_1 in zip(take_drug_t_0, heart_attack_time_1):
    if drug_t_0 == 0 and heart_attack_t_1 == 0:
        proba_heart_attack_time_2.append(0.1)
    elif drug_t_0 == 1 and heart_attack_t_1 == 0:
        proba_heart_attack_time_2.append(0.1)
    elif drug_t_0 == 0 and heart_attack_t_1 == 1:
        proba_heart_attack_time_2.append(0.5)
    elif drug_t_0 == 1 and heart_attack_t_1 == 1:
        proba_heart_attack_time_2.append(0.05)

heart_attack_time_2 = np.random.binomial(
    n=2, p=proba_heart_attack_time_2, size=10000
)

# people who've had a heart attack at time 2 are more likely to die by time 3

proba_survive_t_3 = []
for heart_attack_t_2 in heart_attack_time_2:
    if heart_attack_t_2 == 0:
        proba_survive_t_3.append(0.95)
    else:
        proba_survive_t_3.append(0.6)

survive_t_3 = np.random.binomial(
    n=1, p=proba_survive_t_3, size=10000
)

df = pd.DataFrame(
    {
        'survive_t_3': survive_t_3,
        'take_drug_t_0': take_drug_t_0,
        'heart_attack_time_1': heart_attack_time_1,
        'heart_attack_time_2': heart_attack_time_2
    }
)

# we only have access to data of the people who survived
survive_t_3_data = df[
    df['survive_t_3'] == 1
]

survive_t_3_X = survive_t_3_data[['take_drug_t_0']]

lr = LinearRegression()
lr.fit(survive_t_3_X, survive_t_3_data['heart_attack_time_1'])
lr.coef_

with pm.Model() as collider_bias_model_normal:
    alpha = pm.Normal(name='alpha', mu=0, sd=1)
    take_drug_t_0 = pm.Normal(name='take_drug_t_0', mu=0, sd=1)
    summation = alpha + take_drug_t_0 * survive_t_3_data['take_drug_t_0']
    sigma = pm.Exponential('sigma', lam=1)           

    pm.Normal(
        name='observed', 
        mu=summation,
        sd=sigma,
        observed=survive_t_3_data['heart_attack_time_1']
    )

    collider_bias_normal_trace = pm.sample(2000, tune=1000)

pm.plot_posterior(collider_bias_normal_trace['take_drug_t_0'])

with pm.Model() as no_collider_bias_model_normal:
    alpha = pm.Normal(name='alpha', mu=0, sd=1)
    take_drug_t_0 = pm.Normal(name='take_drug_t_0', mu=0, sd=1)
    summation = alpha + take_drug_t_0 * df['take_drug_t_0']
    sigma = pm.Exponential('sigma', lam=1)           

    pm.Normal(
        name='observed', 
        mu=summation,
        sd=sigma,
        observed=df['heart_attack_time_1']
    )

    no_collider_bias_normal_trace = pm.sample(2000, tune=2000)

pm.plot_posterior(no_collider_bias_normal_trace['take_drug_t_0'])

4

Две статьи, вторая классическая, которые помогают (я думаю) пролить дополнительный свет на точки Иудеи и эту тему в целом. Это исходит от человека, который неоднократно использовал SEM (то есть корреляцию и регрессию) и резонирует с его критикой:

https://www.sciencedirect.com/science/article/pii/S0022103111001466

http://psycnet.apa.org/record/1973-20037-001

По сути, в статьях описывается, почему корреляционные модели (регрессия) обычно не могут восприниматься как подразумевающие какой-либо сильный причинный вывод. Любой шаблон ассоциаций может соответствовать данной ковариационной матрице (то есть, не указание направления и / или отношения между переменными). Отсюда необходимость в таких вещах, как план эксперимента, контрфактивные суждения и т. Д. Это применимо даже тогда, когда человек имеет временную структуру своих данных, где предполагаемая причина возникает во времени до предполагаемого эффекта.


1

«... поскольку мы, по сути, предполагаем, что одна переменная является причиной, а другая - следствием (следовательно, корреляция отличается от регрессионного моделирования) ...»

Моделирование регрессии определенно НЕ делает этого предположения.

«... и проверяем, объясняют ли эти причинно-следственные связи наблюдаемые закономерности».

Если вы принимаете причинно-следственную связь и сравниваете ее с данными наблюдений, вы выполняете SEM-моделирование или то, что Перл назвал бы SCM-моделированием. Вопрос о том, хотите ли вы назвать эту часть домена статистики, спорен. Но я думаю, что большинство не назвало бы это классической статистикой.

Вместо того, чтобы сваливать статистику в целом, я считаю, что Перл просто критикует скрытность статистиков в отношении причинно-следственной семантики. Он считает, что это серьезная проблема из-за того, что Карл Саган называет феноменом «входи и выходи», где вы бросаете исследование, в котором говорится, что «потребление мяса« тесно связано »с повышением либидо, р <0,05», а затем выгибается, зная, что вполне возможно, что два результата будут причинно связаны в сознании общественности.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.