Насколько хорошо множественная регрессия действительно может «контролировать» ковариаты?


45

Мы все знакомы с наблюдательными исследованиями, которые пытаются установить причинно-следственную связь между нерандомизированным предиктором X и результатом путем включения каждого мыслимого потенциального препятствия в модель множественной регрессии. Таким образом, «контролируя» всех нарушителей, мы утверждаем, что мы изолируем эффект предиктора интереса.

Я испытываю растущий дискомфорт от этой идеи, основанной главным образом на необдуманных замечаниях, сделанных различными профессорами моих классов статистики. Они попадают в несколько основных категорий:

1. Вы можете контролировать только те ковариаты, которые вы думаете и измеряете.
Это очевидно, но мне интересно, действительно ли это самое пагубное и непреодолимое из всех.

2. Подход привел к ужасным ошибкам в прошлом.

Например, Petitti & Freedman (2005) обсуждают, как десятилетние статистически скорректированные обсервационные исследования пришли к катастрофически неверным выводам о влиянии заместительной гормональной терапии на риск сердечных заболеваний. Позднее РКИ обнаружили почти противоположные эффекты.

3. Отношение предиктор-результат может вести себя странно, когда вы управляете ковариатами.

Yu-Kang Tu, Gunnell & Gilthorpe (2008) обсуждают некоторые различные проявления, в том числе парадокс Лорда, парадокс Симпсона и переменные-супрессоры.

4. Одной модели (множественной регрессии) сложно адекватно подстраиваться под ковариаты и одновременно моделировать взаимосвязь предиктор-результат.

Я слышал, что это является причиной превосходства таких методов, как оценка склонности и стратификация по отношению к противникам, но я не уверен, что действительно понимаю это.

5. Модель ANCOVA требует, чтобы ковариат и предиктор интереса были независимыми.

Конечно, мы подбираем для собеседников именно то, ПОТОМУ ЧТО они соотносятся с предиктором интереса, поэтому, похоже, модель будет неудачной в тех точных случаях, когда мы этого больше всего хотим. Аргумент гласит, что корректировка подходит только для снижения шума в рандомизированных исследованиях. Миллер и Чепмен, 2001 дают отличный обзор.

Итак, мои вопросы:

  1. Насколько серьезны эти и другие проблемы, о которых я не знаю?
  2. Насколько я должен бояться, когда вижу исследование, которое «контролирует все»?

(Я надеюсь, что этот вопрос не слишком углубится в дискуссионную область, и с радостью предложу любые предложения по его улучшению.)

РЕДАКТИРОВАТЬ : я добавил пункт 5 после поиска новой ссылки.


1
Что касается вопроса 2, я думаю, что «контроль всего» - это более общая проблема спецификации. Мне трудно думать о ситуации, когда параметрическая модель указана правильно. При этом модель упрощает реальность, и именно в этом заключается искусство этого типа исследования. Исследователь должен решить, что является и что не важно в модели.
Кирк

4
С этим вопросом вы сделали меня фанатом.
rolando2

1
Я думаю, что это поднимает некоторые очень хорошие моменты; но я думаю, что ответы находятся за пределами строго статистического поля. Таким образом, любой статистический результат является более ценным, если он 1) тиражируется 2) является практически жизнеспособным и т. Д. Также см. Критерии ВОЛШЕБСТВА и общий аргумент, который приводит Абельсон.
Питер Флом - Восстановить Монику

1
Пункт № 5 абсолютно неверен. Бумага Миллера и Чепмена совершенно неверна, полная остановка.
Джейк Уэстфолл,

1
@ Half-Pass Не уверен, что еще сказать об этом, кроме того, что центральное утверждение статьи - то есть, что фокусный предиктор X и ковариат C должны быть некоррелированными - просто не соответствует действительности. Обратите внимание на то, что ANCOVA - это просто модель регрессии, поэтому такая же логика рассуждений, очевидно, аннулирует практически все реальные применения множественной регрессии! У меня была небольшая дискуссия в Twitter об этой ужасной статье несколько месяцев назад: twitter.com/CookieSci/status/902298218494644228
Джейк Уэстфолл,

Ответы:


4

Существует общепринятый, возможно, нестатистический ответ - какие предположения нужно сделать, чтобы утверждать, что кто-то действительно контролировал ковариаты.

Это можно сделать с помощью причинных графиков Иудеи Перл и сделать исчисление .

См. Http://ftp.cs.ucla.edu/pub/stat_ser/r402.pdf, а также другие материалы на его веб-сайте.

Теперь, как статистикам, мы знаем, что все модели неверны, и реальный статистический вопрос заключается в том, являются ли идентифицированные предположения не слишком неправильными, чтобы наш ответ был примерно нормальным. Перл знает об этом и действительно обсуждает это в своей работе, но, возможно, не явно и не достаточно часто, чтобы не тратить время на то, чтобы многие статистики теряли уверенность в том, что у него есть ответ (что, я полагаю, он делает для того, какие предположения нужно сделать? ).

(В настоящее время ASA предлагает приз за учебный материал для включения этих методов в статистические курсы, см. Здесь )


Отличная ссылка на элегантное графическое представление, спасибо.
половина пройдет

0

Ответ на вопрос 1:

  • Степень серьезности лучше всего оценивать в контексте (то есть следует учитывать все факторы, влияющие на достоверность).
  • Величина серьезности не должна оцениваться категорически. Примером является понятие иерархии логического вывода для планов исследований (например, отчеты о случаях являются самыми низкими, а РКИ категорически самыми высокими). Этот тип схемы часто преподается в медицинских школах как простой эвристический метод для быстрого выявления высококачественных доказательств. Проблема с этим типом мышления заключается в том, что оно является алгоритмическим и чрезмерно детерминированным на самом деле, ответ сам по себе переопределен. Когда это происходит, вы можете пропустить пути, которыми плохо спроектированные РКИ могут дать худшие результаты, чем хорошо спланированное обсервационное исследование.
  • См. Этот легко читаемый обзор для полного обсуждения вышеупомянутых пунктов с точки зрения эпидемиолога (Rothman, 2014) .

Ответ на вопрос 2:

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.