Чтобы ответить на ваш буквальный вопрос: «Допустимо ли включать базовую меру в качестве контрольной переменной при тестировании влияния независимой переменной на оценки изменений?», Ответ - нет . Ответ - нет, потому что по построению базовый показатель коррелирует с ошибочным термином, когда показатель изменения используется в качестве зависимой переменной, следовательно, предполагаемое влияние базового показателя на показатель изменения не подлежит интерпретации.
С помощью
- Y1 как начальный вес
- Y2 как конечный вес
- Δ Y = Y 2 - Y 1ΔY как изменение веса (то есть )ΔY=Y2−Y1
- T в качестве случайно назначенного лечения, и
- X как другие экзогенные факторы, которые влияют на вес (например, другие контрольные переменные, которые связаны с результатом, но не должны коррелировать с лечением из-за случайного назначения)
Затем у модели есть регрессия на и ; T XΔYTX
ΔY=β1T+β2X+e
Который по определению эквивалентен;
Y2−Y1=β1T+β2X+e
Теперь, если вы включите базовую линию как ковариату, вы должны увидеть проблему в том, что у вас есть член с обеих сторон уравнения. Это показывает, что не интерпретируется, поскольку по своей сути коррелирует с ошибкой.β 3 Y 1Y1β3Y1
Y2−Y1Y2=β1T+β2X+β3Y1+e=β1T+β2X+β3Y1+(e+Y1)
Теперь путаница в разных ответах, по-видимому, связана с тем фактом, что разные модели дадут одинаковые результаты для эффекта лечения , в моей приведенной выше формулировке. Таким образом, если сравнивать эффект лечения для модели, используя оценки изменений в качестве зависимой переменной, с моделью, использующей «уровни» (с каждой моделью, включающей базовый уровень как ковариату), интерпретация эффекта лечения будет одно и тоже. В следующих двух моделях будут одинаковыми, как и выводы, основанные на них (Брюс Уивер опубликовал некоторый код SPSS, демонстрирующий также эквивалентность).Y 1 β 1 Tβ1TY1β1T
Change Score ModelLevels Model:Y2−Y1=β1T+β2X+β3Y1+e:Y2=β1T+β2X+β3Y1+e
Так что некоторые будут спорить (как это сделал Феликс в этой теме и как Брюс Уивер обсуждал некоторые вопросы в группе Google SPSS).) поскольку модели приводят к одинаковому оценочному эффекту лечения, не имеет значения, какой из них вы выберете. Я не согласен, потому что базовый ковариат в модели оценки изменений не может быть интерпретирован, вы никогда не должны включать базовый уровень в ковариату (независимо от того, является ли оцененный эффект лечения одинаковым или нет). Таким образом, возникает еще один вопрос: какой смысл использовать оценки изменений в качестве зависимых переменных? Как уже отмечал Феликс, модель, использующая оценку изменения в качестве зависимой переменной, исключая базовую линию как ковариату, отличается от модели, использующей уровни. Чтобы уточнить, последующие модели будут давать различные эффекты лечения (особенно в том случае, если лечение коррелирует с исходным уровнем);
Change Score Model Without BaselineLevels Model:Y2−Y1=β1T+β2X+e:Y2=β1T+β2X+β3Y1+e
Это было отмечено в предшествующей литературе как «парадокс лорда». Так какая модель подходит? Что ж, в случае рандомизированных экспериментов, я бы сказал, что модель уровней предпочтительнее (хотя, если вы хорошо выполнили рандомизацию, средний эффект лечения должен быть очень близок между моделями). Другие отметили причины, по которым модель уровней предпочтительнее . Ответ Чарли дает хорошее представление о том, что вы можете оценить эффекты взаимодействия с базовой линией в модели уровней (но вы не можете в модели оценки изменений). То, что этот ответ на очень похожий вопрос демонстрирует, как оценки изменений вызывают корреляцию между различными методами лечения.
В ситуациях, когда лечение не назначается случайным образом, модели, использующей оценки изменений в качестве зависимой переменной, следует уделять больше внимания. Основным преимуществом модели оценки изменений является то, что контролируются любые не зависящие от времени предикторы результата. Так, скажем, в приведенной выше формулировке постоянно во всем (например, скажем, генетическая предрасположенность к определенному весу), и что соотносится с тем, выбирает ли человек физические упражнения (а не наблюдается). В этом случае модель оценки изменений является предпочтительной. Также в случаях, когда выбор в лечение коррелирует с базовым значением, модель оценки изменения может быть предпочтительной. Пол Эллисон в своей статье,XXXИзменение баллов в качестве зависимых переменных в регрессионном анализе приводит те же примеры (и в значительной степени повлияло на мою точку зрения на эту тему, поэтому я настоятельно рекомендую ее прочитать).
Это не означает, что оценки изменений всегда предпочтительнее в нерандомизированных условиях. В случае, если вы ожидаете, что базовый уровень окажет реальное причинное влияние на вес сообщения, вы должны использовать модель уровней. В случае, если вы ожидаете, что базовый уровень будет иметь причинно-следственный эффект, и выбор лечения коррелирует с базовым уровнем, эффект лечения смешивается с базовым эффектом.
Я проигнорировал примечание Чарли о том, что логарифм веса можно использовать в качестве зависимой переменной. Хотя я не сомневаюсь, что это может быть возможностью, это несколько не является следствием первоначального вопроса. Другой вопрос обсуждался, когда целесообразно использовать логарифмы переменной (и они все еще применяются в этом случае). Вероятно, имеется предшествующая литература по этому вопросу, которая поможет вам определить, подходит ли использование зарегистрированного веса.
цитирование
Allison, Paul D. 1990. Изменение показателей как зависимых переменных в регрессионном анализе . Социологическая методология 20: 93-114. Публичная версия PDF .