Насколько хорошо множественная регрессия действительно может «контролировать» ковариаты?

Мы все знакомы с наблюдательными исследованиями, которые пытаются установить причинно-следственную связь между нерандомизированным предиктором X и результатом путем включения каждого мыслимого потенциального препятствия в модель множественной регрессии. Таким образом, «контролируя» всех нарушителей, мы утверждаем, что мы изолируем эффект предиктора интереса.

Я испытываю растущий дискомфорт от этой идеи, основанной главным образом на необдуманных замечаниях, сделанных различными профессорами моих классов статистики. Они попадают в несколько основных категорий:

1. Вы можете контролировать только те ковариаты, которые вы думаете и измеряете.
Это очевидно, но мне интересно, действительно ли это самое пагубное и непреодолимое из всех.

2. Подход привел к ужасным ошибкам в прошлом.

Например, Petitti & Freedman (2005) обсуждают, как десятилетние статистически скорректированные обсервационные исследования пришли к катастрофически неверным выводам о влиянии заместительной гормональной терапии на риск сердечных заболеваний. Позднее РКИ обнаружили почти противоположные эффекты.

3. Отношение предиктор-результат может вести себя странно, когда вы управляете ковариатами.

Yu-Kang Tu, Gunnell & Gilthorpe (2008) обсуждают некоторые различные проявления, в том числе парадокс Лорда, парадокс Симпсона и переменные-супрессоры.

4. Одной модели (множественной регрессии) сложно адекватно подстраиваться под ковариаты и одновременно моделировать взаимосвязь предиктор-результат.

Я слышал, что это является причиной превосходства таких методов, как оценка склонности и стратификация по отношению к противникам, но я не уверен, что действительно понимаю это.

5. Модель ANCOVA требует, чтобы ковариат и предиктор интереса были независимыми.

Конечно, мы подбираем для собеседников именно то, ПОТОМУ ЧТО они соотносятся с предиктором интереса, поэтому, похоже, модель будет неудачной в тех точных случаях, когда мы этого больше всего хотим. Аргумент гласит, что корректировка подходит только для снижения шума в рандомизированных исследованиях. Миллер и Чепмен, 2001 дают отличный обзор.

Итак, мои вопросы:

Насколько серьезны эти и другие проблемы, о которых я не знаю?
Насколько я должен бояться, когда вижу исследование, которое «контролирует все»?

(Я надеюсь, что этот вопрос не слишком углубится в дискуссионную область, и с радостью предложу любые предложения по его улучшению.)

РЕДАКТИРОВАТЬ : я добавил пункт 5 после поиска новой ссылки.

multiple-regression ancova observational-study

— Принимание
источник

Что касается вопроса 2, я думаю, что «контроль всего» - это более общая проблема спецификации. Мне трудно думать о ситуации, когда параметрическая модель указана правильно. При этом модель упрощает реальность, и именно в этом заключается искусство этого типа исследования. Исследователь должен решить, что является и что не важно в модели.

— Кирк

С этим вопросом вы сделали меня фанатом.

— rolando2

Я думаю, что это поднимает некоторые очень хорошие моменты; но я думаю, что ответы находятся за пределами строго статистического поля. Таким образом, любой статистический результат является более ценным, если он 1) тиражируется 2) является практически жизнеспособным и т. Д. Также см. Критерии ВОЛШЕБСТВА и общий аргумент, который приводит Абельсон.

— Питер Флом - Восстановить Монику

Пункт № 5 абсолютно неверен. Бумага Миллера и Чепмена совершенно неверна, полная остановка.

— Джейк Уэстфолл,

@ Half-Pass Не уверен, что еще сказать об этом, кроме того, что центральное утверждение статьи - то есть, что фокусный предиктор X и ковариат C должны быть некоррелированными - просто не соответствует действительности. Обратите внимание на то, что ANCOVA - это просто модель регрессии, поэтому такая же логика рассуждений, очевидно, аннулирует практически все реальные применения множественной регрессии! У меня была небольшая дискуссия в Twitter об этой ужасной статье несколько месяцев назад: twitter.com/CookieSci/status/902298218494644228

— Джейк Уэстфолл,

Ответы:

Существует общепринятый, возможно, нестатистический ответ - какие предположения нужно сделать, чтобы утверждать, что кто-то действительно контролировал ковариаты.

Это можно сделать с помощью причинных графиков Иудеи Перл и сделать исчисление .

См. Http://ftp.cs.ucla.edu/pub/stat_ser/r402.pdf, а также другие материалы на его веб-сайте.

Теперь, как статистикам, мы знаем, что все модели неверны, и реальный статистический вопрос заключается в том, являются ли идентифицированные предположения не слишком неправильными, чтобы наш ответ был примерно нормальным. Перл знает об этом и действительно обсуждает это в своей работе, но, возможно, не явно и не достаточно часто, чтобы не тратить время на то, чтобы многие статистики теряли уверенность в том, что у него есть ответ (что, я полагаю, он делает для того, какие предположения нужно сделать? ).

(В настоящее время ASA предлагает приз за учебный материал для включения этих методов в статистические курсы, см. Здесь )

— фанерон
источник

Отличная ссылка на элегантное графическое представление, спасибо.

— половина пройдет

Ответ на вопрос 1:

Степень серьезности лучше всего оценивать в контексте (то есть следует учитывать все факторы, влияющие на достоверность).
Величина серьезности не должна оцениваться категорически. Примером является понятие иерархии логического вывода для планов исследований (например, отчеты о случаях являются самыми низкими, а РКИ категорически самыми высокими). Этот тип схемы часто преподается в медицинских школах как простой эвристический метод для быстрого выявления высококачественных доказательств. Проблема с этим типом мышления заключается в том, что оно является алгоритмическим и чрезмерно детерминированным на самом деле, ответ сам по себе переопределен. Когда это происходит, вы можете пропустить пути, которыми плохо спроектированные РКИ могут дать худшие результаты, чем хорошо спланированное обсервационное исследование.
См. Этот легко читаемый обзор для полного обсуждения вышеупомянутых пунктов с точки зрения эпидемиолога (Rothman, 2014) .

Ответ на вопрос 2:

Очень бояться Чтобы просто повторить то, что уже сказали другие, и процитировать (грубо) изящный вводный текст Ричарда МакЭлриента о критическом мышлении в статистическом моделировании :

«... все модели ложные, но некоторые полезны ...»

— Flaunk
источник