Допустимо ли включать базовую меру в качестве контрольной переменной при тестировании влияния независимой переменной на оценки изменений?


38

Я пытаюсь запустить регрессию OLS:

  • DV: изменение веса за год (начальный вес - конечный вес)

  • IV: Независимо от того вы занимаетесь спортом.

Тем не менее, кажется разумным, что более тяжелые люди будут терять больше веса на единицу нагрузки, чем более худые люди. Таким образом, я хотел включить переменную управления:

  • CV: начальный стартовый вес.

Однако теперь начальный вес используется ОБА для вычисления зависимой переменной И в качестве контрольной переменной.

Это нормально? Это нарушает предположение об OLS?


4
Было ли лечение назначено случайным образом?
Энди В.

1
Обратите внимание, что недавно был задан еще один очень похожий вопрос - stats.stackexchange.com/q/15104/1036 . Ответ на этот вопрос применим к этому вопросу (на самом деле, я бы сказал, что это дублирующие вопросы).
Энди W

3
@ Andy На самом деле, эти два вопроса достаточно разные, и я бы дал другой ответ, чем другой. Чарли уже дал хороший анализ здесь.
whuber

3
Обратите внимание, что использование различий обычно ассоциируется со значительным снижением надежности, хотя это несколько обсуждается
Behacad

Ответы:


25

Чтобы ответить на ваш буквальный вопрос: «Допустимо ли включать базовую меру в качестве контрольной переменной при тестировании влияния независимой переменной на оценки изменений?», Ответ - нет . Ответ - нет, потому что по построению базовый показатель коррелирует с ошибочным термином, когда показатель изменения используется в качестве зависимой переменной, следовательно, предполагаемое влияние базового показателя на показатель изменения не подлежит интерпретации.

С помощью

  • Y1 как начальный вес
  • Y2 как конечный вес
  • Δ Y = Y 2 - Y 1ΔY как изменение веса (то есть )ΔY=Y2Y1
  • T в качестве случайно назначенного лечения, и
  • X как другие экзогенные факторы, которые влияют на вес (например, другие контрольные переменные, которые связаны с результатом, но не должны коррелировать с лечением из-за случайного назначения)

Затем у модели есть регрессия на и ; T XΔYTX

ΔY=β1T+β2X+e

Который по определению эквивалентен;

Y2Y1=β1T+β2X+e

Теперь, если вы включите базовую линию как ковариату, вы должны увидеть проблему в том, что у вас есть член с обеих сторон уравнения. Это показывает, что не интерпретируется, поскольку по своей сути коррелирует с ошибкой.β 3 Y 1Y1β3Y1

Y2Y1=β1T+β2X+β3Y1+eY2=β1T+β2X+β3Y1+(e+Y1)

Теперь путаница в разных ответах, по-видимому, связана с тем фактом, что разные модели дадут одинаковые результаты для эффекта лечения , в моей приведенной выше формулировке. Таким образом, если сравнивать эффект лечения для модели, используя оценки изменений в качестве зависимой переменной, с моделью, использующей «уровни» (с каждой моделью, включающей базовый уровень как ковариату), интерпретация эффекта лечения будет одно и тоже. В следующих двух моделях будут одинаковыми, как и выводы, основанные на них (Брюс Уивер опубликовал некоторый код SPSS, демонстрирующий также эквивалентность).Y 1 β 1 Tβ1TY1β1T

Change Score Model:Y2Y1=β1T+β2X+β3Y1+eLevels Model:Y2=β1T+β2X+β3Y1+e

Так что некоторые будут спорить (как это сделал Феликс в этой теме и как Брюс Уивер обсуждал некоторые вопросы в группе Google SPSS).) поскольку модели приводят к одинаковому оценочному эффекту лечения, не имеет значения, какой из них вы выберете. Я не согласен, потому что базовый ковариат в модели оценки изменений не может быть интерпретирован, вы никогда не должны включать базовый уровень в ковариату (независимо от того, является ли оцененный эффект лечения одинаковым или нет). Таким образом, возникает еще один вопрос: какой смысл использовать оценки изменений в качестве зависимых переменных? Как уже отмечал Феликс, модель, использующая оценку изменения в качестве зависимой переменной, исключая базовую линию как ковариату, отличается от модели, использующей уровни. Чтобы уточнить, последующие модели будут давать различные эффекты лечения (особенно в том случае, если лечение коррелирует с исходным уровнем);

Change Score Model Without Baseline:Y2Y1=β1T+β2X+eLevels Model:Y2=β1T+β2X+β3Y1+e

Это было отмечено в предшествующей литературе как «парадокс лорда». Так какая модель подходит? Что ж, в случае рандомизированных экспериментов, я бы сказал, что модель уровней предпочтительнее (хотя, если вы хорошо выполнили рандомизацию, средний эффект лечения должен быть очень близок между моделями). Другие отметили причины, по которым модель уровней предпочтительнее . Ответ Чарли дает хорошее представление о том, что вы можете оценить эффекты взаимодействия с базовой линией в модели уровней (но вы не можете в модели оценки изменений). То, что этот ответ на очень похожий вопрос демонстрирует, как оценки изменений вызывают корреляцию между различными методами лечения.

В ситуациях, когда лечение не назначается случайным образом, модели, использующей оценки изменений в качестве зависимой переменной, следует уделять больше внимания. Основным преимуществом модели оценки изменений является то, что контролируются любые не зависящие от времени предикторы результата. Так, скажем, в приведенной выше формулировке постоянно во всем (например, скажем, генетическая предрасположенность к определенному весу), и что соотносится с тем, выбирает ли человек физические упражнения (а не наблюдается). В этом случае модель оценки изменений является предпочтительной. Также в случаях, когда выбор в лечение коррелирует с базовым значением, модель оценки изменения может быть предпочтительной. Пол Эллисон в своей статье,XXXИзменение баллов в качестве зависимых переменных в регрессионном анализе приводит те же примеры (и в значительной степени повлияло на мою точку зрения на эту тему, поэтому я настоятельно рекомендую ее прочитать).

Это не означает, что оценки изменений всегда предпочтительнее в нерандомизированных условиях. В случае, если вы ожидаете, что базовый уровень окажет реальное причинное влияние на вес сообщения, вы должны использовать модель уровней. В случае, если вы ожидаете, что базовый уровень будет иметь причинно-следственный эффект, и выбор лечения коррелирует с базовым уровнем, эффект лечения смешивается с базовым эффектом.

Я проигнорировал примечание Чарли о том, что логарифм веса можно использовать в качестве зависимой переменной. Хотя я не сомневаюсь, что это может быть возможностью, это несколько не является следствием первоначального вопроса. Другой вопрос обсуждался, когда целесообразно использовать логарифмы переменной (и они все еще применяются в этом случае). Вероятно, имеется предшествующая литература по этому вопросу, которая поможет вам определить, подходит ли использование зарегистрированного веса.


цитирование

Allison, Paul D. 1990. Изменение показателей как зависимых переменных в регрессионном анализе . Социологическая методология 20: 93-114. Публичная версия PDF .


3
В уравнении если в соответствии со стандартной практикой мы предполагаем, что все ковариаты не являются случайными переменными, то не коррелирует с . Таким образом, я думаю, что есть проблема только в том случае, если вы рассматриваете как случайный, и в этом случае (опять-таки, только мое мнение) вы должны моделировать совместно, но без как ковариаты. В этом отношении без пропущенных данных мне сообщили, что этот подход эквивалентен являющемуся фиксированной ковариатой (я постараюсь найти некоторые ссылки для этого). Y2=β1T+β2X+β3Y1+(e+Y1)Y1e+Y1Y1(Y1,Y2)Y1Y1
Дандар

1
@ dandar, это утверждение не имеет смысла для меня. Обратите внимание, что - это значение результата до обработки , а не переменная, которой манипулируют в эксперименте. Вы говорите, что если у меня есть базовое значение , то я эксперимент, а затем измеряю , мне следует смоделировать и как функцию экспериментального вмешательства? Y1Y1Y2Y1Y2
Энди В.

1
Модель, о которой я говорю, действительно подразумевает, что является функцией лечения, но только с точки зрения того, что, несмотря на рандомизацию, всегда будут небольшие различия между группой лечения и контрольной группой относительно их базовых средних значений. Таким образом, будет учитывать эту разницу, а также эффект лечения. Ссылка для этого («Продольный анализ данных непрерывных и дискретных ответов для предварительных проектов», Zeger and Liang, 2000). β 1Y1β1
Дандар

1
Четкое обсуждение этого документа можно найти в («Должен ли базовый уровень быть ковариатной или зависимой переменной в анализе изменений по сравнению с базовым уровнем в клинических испытаниях?», Liu, Mogg, Mallick and Mehrotra 2009). Они ссылаются на эту модель как на безусловную модель (т. Е. Она не обуславливает базовый отклик). В статье Liu (2009) обсуждаются основные результаты работы Zeger (2000). Это, во-первых, что при отсутствии отсутствующих данных точечные оценки из безусловной модели такие же, как и из условного подхода ANCOVA с использованием пост-базовой линииB1
dandar

1
измерение как ответ и обусловливание фиксированным базовым значением, и, во-вторых, отклонение оценки точки от модели ANCOVA всегда больше или равно таковому от безусловной. Оказывается, что эта разница обычно будет небольшой из-за рандомизации, гарантирующей, что базовые средние ответы между группами невелики. Авторы приходят к выводу, что безусловная модель подходит для моделирования базовой линии в качестве случайной переменной, но ANCOVA - в зависимости от обстоятельств при ее просмотре как фиксированной
Дандар

21

Кажется, ответ Энди - это взгляд экономиста на вещи. В клинических испытаниях принято почти всегда корректировать базовую версию переменной отклика, чтобы значительно увеличить мощность. Так как мы определяем базовые переменные, «ошибка» не позволяет их путать с общей ошибкой. Единственная проблема заключается в том, что ошибки измерения в базовой ковариате смешиваются с другим X, искажая эффект этого другого X. Общий предпочтительный метод состоит в том, чтобы скорректировать базовую линию и смоделировать переменную ответа, а не вычислять изменение. Одна из причин этого заключается в том, что изменение сильно зависит от правильного преобразования Y, и это изменение не относится к регрессионным моделям в целом. Например, если Y является порядковым, разница между двумя порядковыми переменными больше не является порядковой.


1
Я не до конца понимаю этот ответ. Что ты имеешь в виду под "настроить на базовый уровень"? Взять разницу или контроль за ней?
Хенрик

3
Под «поправкой на базовую линию» я подразумевал включение базовой линии в качестве ковариации. Также часто используются оценки изменений, но вы не можете использовать их, не корректируя базовую линию как ковариату (следовательно, зачем беспокоиться о показателях изменений?).
Фрэнк Харрелл

6
На самом деле то, что вы говорите здесь (или в ответ на комментарии Феликса), не противоречит тому, что я говорю. Использование оценок изменений не «подстраивается под базовый уровень», оно контролирует любые опущенные по времени переменные (или если выбор в лечение сильно коррелирует с базовым уровнем). Если базовый уровень не является ничтожным (то есть он оказывает прямое причинно-следственное влияние на результат или имеет взаимодействие с лечением), изменение баллов не решает проблему.
Энди W

2
@Frank Harrell Спасибо за участие в этом обсуждении и разъяснение этого. (+1)
Хенрик

8

Мы можем немного изменить рассуждения @ ocram, чтобы

E[w1w0X,w0]=β0+xβ+w0γE[w1X,w0]=β0+xβ+w0(γ+1)

Итак, если это правильная модель , то, говоря, что разница зависит от веса, подразумевается, что конечное значение зависит от начального значения с коэффициентом, который может быть любым. Выполнение регрессии разности по и или конечного веса по одним и тем же переменным должно дать вам одинаковые коэффициенты для всех, кроме . Но если эта модель не совсем верна, эти регрессии дадут другие результаты и для других коэффициентов.xw0w0

Обратите внимание, что эта установка подразумевает, что начальный вес предсказывает разницу в весах, а не влияние лечения . Для этого потребуется термин взаимодействия, возможно,

E[w1w0X,w0]=β0+(xw0)β+w0γ.

Другой подход состоит в том, чтобы вычислить здесь, - скорость роста веса. Это может быть вашим результатом. Ваши коэффициенты на будут говорить вам, как эти предикторы связаны с изменениями пропорций в весе. Это «контролирует» начальный вес, говоря, что, например, режим упражнений, который уменьшает вес на 10% (коэффициент 0,1, умноженный на 100%) для человека, который весит 130 фунтов, уменьшает вес на 13 фунтов, в то время как программа уменьшает вес участника 200 фунтов на 20 фунтов. В этом случае вам может не потребоваться указывать начальный вес (или его журнал) с правой стороны.

log(w1)log(w0)r;
rx

Термин взаимодействия все еще может быть необходим, если вы считаете, что влияние программы зависит от стартового веса. Если вы используете в термине взаимодействия, то программа будет связана с изменением скорости роста веса. Каждый фунт, который тяжелее, чем человек был в начале программы, приводит к увеличению скорости роста на (это является кросс-частной производной ожидаемого значения как для лечения, так и для стартового веса).w0w0β1β1

Если вы используете в термине взаимодействия, влияние программы увеличивается на для каждого дополнительного фунта, который тяжелее был у участника в начале программы.log(w0)β1/w0

Как вы можете видеть, кросс-партиалы в терминах взаимодействия могут быть немного сложными для интерпретации, но они могут отражать влияние, которое вас интересует.


Привет, Чарли, я вижу преимущество в использовании изменения пропорций, однако почему вы обнаруживаете разницу в регистрируемых переменных, а не просто деление w1 на w0.
ChrisStata

Мне нравится идея пропорционального изменения. Однако остается вопрос, является ли ожидаемое взаимодействие буквально пропорциональным или нет. Если нет, вам все равно нужно будет указывать начальный вес как ковариату. Или вы были бы уверены, что с такой же трудностью потерять 10% своего веса для человека весом 100 или 200 фунтов ??
Хенрик

@ChrisStata, вы тоже можете это сделать. Я экономист, и нам очень нравятся наши журналы (и различия тоже). Если бы у вас был временной ряд (т. Е. Несколько наблюдений) для каждого человека (создание набора данных панели), я мог бы утверждать, что мой путь лучше, но здесь это не имеет значения. Хенрик, ты прав; Я добавил немного об этом в свой ответ.
Чарли

8

РЕДАКТИРОВАТЬ: аргумент Энди W убедил меня отказаться от модели C. Я добавил еще одну возможность: анализ изменений с помощью моделей случайных коэффициентов (многоуровневых моделей или моделей со смешанными эффектами)

Было много научных дебатов об использовании различий. Мои любимые тексты - это Рогоза (1982, [1]) и Фицморис, Лэйрд и Уэйр (2004, [2])

В целом, у вас есть три возможности анализа ваших данных:

  • A) Принимайте только баллы за разницу между индивидуумами (оценка изменений)
  • Б) Относитесь к последующему измерению как к DV и управляйте им для базовой линии.
  • C) Возьмите разницу в качестве DV и контролируйте ее для базовой линии (это модель, которую вы предложили). Из-за аргументов Энди У, я отбросил эту альтернативу
  • D) Использование подхода многоуровневой / смешанной модели эффекта, при котором линия регрессии моделируется для каждого участника, а участник рассматривается как единицы уровня 2.

Модели A и B могут давать очень разные результаты, если базовая линия коррелирует с оценкой изменения (например, у более тяжелых людей больше потеря веса), и / или назначение лечения коррелируется с базовой линией.

Если вы хотите узнать больше об этих проблемах, смотрите цитируемые статьи или здесь и здесь .

Также было проведено недавнее имитационное исследование [3], в котором эмпирически сравниваются условия, при которых A или B являются предпочтительными.

Для полностью сбалансированных конструкций без пропущенных значений Модель D должна быть эквивалентна Модели A. Однако она дает вам больше информации об изменчивости между людьми, она легко распространяется на большее количество точек измерения и обладает хорошими свойствами при наличии несбалансированных данных. и / или пропущенные значения.

В итоге: в вашем случае я бы проанализировал пост-меры, контролируемые для базового уровня (Модель B).

[1] Рогоза Д., Брандт Д. и Зимовски М. (1982). Кривая роста подход к измерению изменений. Психологический вестник, 92, 726-748.

[2] Fitzmaurice, GM, Laird, NM, & Ware, JH (2004). Прикладной продольный анализ. Хобокен, Нью-Джерси: Wiley.

[3] Petscher, Y., & Schatschneider, C., 2011. Имитационное исследование производительности простых разностных и ковариационно-скорректированных показателей в рандомизированных экспериментальных схемах. Журнал образовательных измерений, 48, 31-43.


Я отклонил этот ответ, и вы можете видеть мой ответ на вопрос, почему я считаю, что оценки изменений с базовой линией как ковариатом не должны выполняться. Подводя итог, можно сказать, что даже несмотря на то, что модели B и C в вашей рецептуре дают эквивалентные эффекты лечения, это не означает, что модель C предпочтительнее. Фактически, базовый эффект в модели C не интерпретируется, поэтому я утверждаю, что его не следует использовать.
Энди Ш

@AndyW: Ваш аргумент убедил меня; хотя наиболее релевантная оценка эффекта лечения одинакова в обеих моделях, модель B должна быть предпочтительнее модели C. Я соответствующим образом скорректировал свой ответ. Но что вы говорите Laird, N. (1983). Further Comparative Analyses of Pretest-Posttest Research Designs. The American Statistician, 37, 329-330.? Кто показывает эквивалентность B и C?
Феликс С

Я не думаю, что что-то, что я сказал, противоречит статье Laird. По сути, все мои разговоры заключались в том, что (в обозначениях Лейрда) не интерпретируется, поэтому зачем сообщать об этом (эквивалентность не рассматривалась). Laird делает другие комментарии о том, как базовый ковариатный эффект может быть интерпретирован как гипотеза, если отдельные группы лечения не изменяются (хотя все еще критически настроены по этому поводу). Не стесняйтесь противопоставлять мою точку зрения ситуациям, в которых полезен (он, безусловно, бесполезен в обычных интерпретациях коэффициентов регрессии). b¯b¯
Энди W

Один момент для модели D. Мне интересно, почему не рассматривается только модель D. Она является наиболее последовательной (базовое значение является случайной величиной и ее нельзя принудительно переводить в зависимую переменную), она проста, очень гибка (взаимодействие может быть добавлено) и обеспечивает также стандартное отклонение населения.
Джордано

3

См. Джош Ангрист именно по этому вопросу: http://www.mostlyharmlesseconometrics.com/2009/10/adding-lagged-dependent-vars-to-differenced-models/ . Он идет в основном против включения в вашу модель отстающих DV. В его ответе нет ничего такого, чего нет в ответах выше, но может помочь более краткий ответ на ваш вопрос.


3

Glymour et al. (2005) рассмотрены с использованием базовой корректировки при анализе оценки изменений. Если изменение в состоянии здоровья предшествовало оценке исходного уровня или имеется большая ошибка измерения в зависимой переменной, они обнаруживают, что смещение может возникнуть, если регрессионная модель, использующая оценку изменения в качестве зависимой переменной, включает в себя базовый ковариат. Ответ Фрэнка Харрелла: «Единственная проблема будет в том случае, если ошибки измерения в базовом ковариате смешиваются с другим X, искажая эффект этого другого X». может отражать тот же уклон, что и адреса Glymour.

Glymour (2005) «Когда базовая корректировка полезна в анализе изменений? Пример с образованием и когнитивными изменениями. Американский журнал эпидемиологии 162: 267-278


1

Окрам не правильно. Разница в весах не учитывает начальный вес. В частности, начальный вес вычитается путем вычитания из него конечного веса.

Поэтому я бы сказал, что это не нарушает никаких предположений, если вы контролируете исходный вес.

(Та же логика применяется, если вы берете разницу ИМТ и начального ИМТ.)


Обновление
После критики Энди В. позвольте мне быть более формальным о том, почему я прав, а Окрам неправ (по крайней мере, с моей точки зрения).

У каждого человека есть некоторый абсолютный уровень веса (например, около 100 фунтов против 200 фунтов). Пусть будет этим абсолютным весом. Затем начальный вес можно формализовать как а конечный вес - какaw
iw=awew=aw+Δw

Таким образом, DV, который ОП хочет использовать, являетсяΔw=iwew=awaw+Δw=Δw

Другими словами, абсолютный уровень веса (формализованный как ) выпадает из уравнения, представляющего dv, и, следовательно, не загрязняет его (что не соответствует утверждению Энди В.).aw

Если вы хотите принять это во внимание, вам нужно включить его в вашу модель отдельно (как обычный параметр и / или как термин взаимодействия).

Очевидно, что та же самая логика применима к и может быть легко приспособлена к пропорциям, где можно сказать, например: e w = a wp r o p Δ wΔBMJew=awpropΔw


Когда я сказал, что разница учитывает начальный вес, я это и имел в виду. А конкретно, что бы вы написали? конечный вес - начальный вес = ...?
Октябрь

Как я уже писал, ваша аргументация мне кажется ложной. Я бы сказал, что на самом деле конечный вес больше учитывает начальный вес, так как он находится на той же «шкале», тогда как различие «пересчитывается» (как конечный вес, поэтому некоторое абсолютное значение вычитается из другого абсолютного значения).
Хенрик

(-1) Это не правильно. В общем случае не следует включать одну и ту же переменную как в правую, так и в левую части уравнения (так как это приводит к тому, что независимая переменная коррелирует с ошибкой). Поэтому, если вы используете различия для зависимой переменной, вы не должны включать базовую линию как ковариату.
Энди В.

@ Энди В.: Я знаю, что ваш аргумент в принципе верен. Но мой аргумент заключается в том, что вы как бы частично отбираете абсолютное значение (вычитая конечное значение из базовой линии), тем самым устраняя эту корреляцию. Следовательно, добавление его как ковариаты не приводит к такой корреляции ложных ошибок.
Хенрик

@Henrik, посмотри мой ответ на этот вопрос, и почему я до сих пор считаю, что это мнение ошибочно.
Энди Ш

0

Соблюдайте это

end weightinitial weightY=β0+βTx

эквивалентно

end weight=initial weight+β0+βTx

Словом, использование изменения веса (вместо самого конечного веса) в качестве DV уже учитывает начальный вес.


1
Но я предполагаю, что может быть взаимодействие между начальным весом и потерей веса при тренировке. Скажем, взрослый с ростом 1,90 м и массой тела 70 кг и взрослый с ростом 1,60 м и массой тела 90 кг принимают участие в тех же тренировочных упражнениях. Могу поспорить, что последний теряет больше веса. Если подумать: возможно, индекс массы тела - это лучшее резюме, чем просто вес.
xmjx

1
@xmjx: Если вы думаете, что начальный вес повлияет на конечный вес - и вы, вероятно, правы - тогда будет хорошей идеей ввести его в качестве смещения в модели, как это делается здесь ...
ocram

3
Не правильно в целом. Если наклон базового веса не равен 1,0, то анализ изменений не будет эквивалентен анализу окончательного веса, если исходный вес не указан в обеих моделях и вы не используете обычную регрессию. Если базовый вес находится в двух местах, модель на самом деле труднее объяснить, поэтому причины сохранения этого подхода неясны.
Фрэнк Харрелл
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.