Я читаю Книгу Почему Иудеи Перл, и она становится у меня под кожей 1 . В частности, мне кажется, что он безоговорочно избивает «классическую» статистику, выдвигая аргумент, что статистика никогда не сможет исследовать причинно-следственные связи, никогда не будет интересоваться причинно-следственными связями и что статистика «стала моделью предприятие по сокращению данных ". Статистика становится уродливым s-словом в его книге.
Например:
Статистики были очень смущены тем, какие переменные должны и не должны контролироваться, поэтому по умолчанию практикуется контроль всего, что можно измерить. [...] Это удобная и простая процедура, но она расточительна и содержит ошибки. Ключевым достижением Причинной революции было положить конец этой путанице.
В то же время статистики сильно недооценивают контроль в том смысле, что им не хочется говорить о причинности вообще [...]
Тем не менее, причинно-следственные модели были в статистике, как, навсегда. Я имею в виду, что регрессионная модель может использоваться по существу как причинно-следственная модель, поскольку мы по существу предполагаем, что одна переменная является причиной, а другая - следствием (следовательно, корреляция отличается от подхода регрессионного моделирования), и проверяем, объясняет ли это причинно-следственная связь наблюдаемые закономерности. ,
Другая цитата:
Неудивительно, что статистики, в частности, сочли эту головоломку [проблему Монти Холла] трудной для понимания. Они привыкли, как выразился Р. А. Фишер (1922), к «сокращению данных» и игнорированию процесса генерации данных.
Это напоминает мне ответ Эндрю Гельмана на знаменитый карикатуру xkcd о байесовских и частых людях: «Тем не менее, я думаю, что мультфильм в целом несправедлив в том смысле, что он сравнивает разумного байесовского статистика с частыми статистами, который слепо следует совету мелких учебников. «.
Количество искаженного представления s-слова, которое, как я понимаю, существует в книге Иудеи Перлз, заставило меня задуматься о том, сомнительна ли причинная связь (которую я до сих пор воспринимал как полезный и интересный способ организации и проверки научной гипотезы 2 ).
Вопросы: вы думаете, что Иудея Перл искажает статистику, и если да, то почему? Просто чтобы причинный вывод звучал больше, чем он есть? Вы думаете, что причинный вывод - это Революция с большим R, которая действительно меняет все наше мышление?
Редактировать:
Приведенные выше вопросы являются моей основной проблемой, но, поскольку они, по общему признанию, являются самоуверенными, пожалуйста, ответьте на эти конкретные вопросы (1) в чем смысл «причинной революции»? (2) чем она отличается от "ортодоксальной" статистики?
1. Кроме того, потому что он такой скромный парень.
2. Я имею в виду в научном, а не статистическом смысле.
РЕДАКТИРОВАТЬ : Эндрю Гельман написал это сообщение в блоге на книгу Иудеи Перлз, и я думаю, что он сделал гораздо лучше, объясняя мои проблемы с этой книгой, чем я. Вот две цитаты:
На странице 66 книги Перл и Маккензи пишут, что статистика «превратилась в предприятие по сокращению данных, которое не использует модели». Эй! Какого черта ты несешь?? Я статистик, я занимаюсь статистикой в течение 30 лет, работаю в областях от политики до токсикологии. «Слепое моделирование данных»? Это просто фигня. Мы постоянно используем модели.
И еще один:
Смотреть. Я знаю о дилемме плюрализма. С одной стороны, Перл считает, что его методы лучше, чем все, что было раньше. Хорошо. Для него и многих других они являются лучшими инструментами для изучения причинно-следственных связей. В то же время, как плюралист или студент, изучающий историю, мы понимаем, что существует много способов испечь торт. Трудно проявлять уважение к подходам, которые на самом деле не работают для вас, и в какой-то момент единственный способ сделать это - сделать шаг назад и осознать, что реальные люди используют эти методы для решения реальных проблем. Например, я думаю, что принятие решений с использованием p-значений - ужасная и логически несвязная идея, которая привела к множеству научных катастроф; в то же время многим ученым удается использовать p-значения в качестве инструментов для обучения. Я признаю это. По аналогии, Я бы порекомендовал Перлу признать, что аппарат статистики, иерархического регрессионного моделирования, взаимодействия, посттратификации, машинного обучения и т. Д. И т. Д. Решает реальные проблемы в причинно-следственной связи. Наши методы, как и у Перла, также могут испортить - GIGO! - и, возможно, Перл прав, что нам всем было бы лучше перейти на его подход. Но я не думаю, что это помогает, когда он дает неточные заявления о том, что мы делаем.