Что происходит, когда я включаю квадратную переменную в регрессию?


20

Я начну с моей регрессии OLS: где D - фиктивная переменная, оценки становятся отличными от нуля с низким значением p. Затем я предварительно провожу тест СБРОСА Рэмси и нахожу, что у меня есть некоторая неправильная оценка уравнения, поэтому я включаю квадрат x: y = β 0 + β 1 x 1 + β 2 x 2 1 + β 3 D + ε

y=β0+β1x1+β2D+ε
Yзнак равноβ0+β1Икс1+β2Икс12+β3D+ε
  1. Что объясняет квадратный термин? (Нелинейное увеличение Y?)
  2. При этом моя оценка D больше не меняется от нуля с высоким значением p. Как мне интерпретировать квадратное слагаемое в моем уравнении (в общем)?

Изменить: Улучшение вопроса.



1
Вероятная причина: Икс12 и D видимому, объясняют одну и ту же изменчивость Y
устойчивая рыба

3
Одна вещь, которая может помочь, это центрировать Икс перед созданием вашего квадрата (см. Здесь ). Что касается интерпретации вашего квадратного термина, я утверждаю, что лучше всего интерпретировать β1Икс1+β2Икс12 в целом (см. Здесь ). Другое дело, что вам может понадобиться взаимодействие, то есть добавление β4Икс1D+β5Икс12D .
gung - Восстановить Монику

Я не думаю, что это действительно дубликат этого вопроса; решение другое (центрирующие переменные работают здесь, но не там, если я не ошибаюсь)
Питер Флом - Восстановить Монику

@ Питер, я интерпретирую этот вопрос как подмножество «Почему, когда я добавляю переменную в мою модель, оценка эффекта / значение для некоторых других переменных изменяется?», Который рассматривается в другом вопросе. Среди ответов на эти вопросы - коллинеарность (на которую ссылается банда в своем ответе на этот вопрос) / дублирование контента между предикторами (то есть между и , что, как я подозреваю, является виновником в данном случае). Та же логика применима и здесь. Я не уверен, что спор, но это хорошо, если вы и другие не согласны. Приветствия. D ( x 1 , x 2 1 )пD(Икс1,Икс12)
Макро

Ответы:


21

Ну, во-первых, фиктивная переменная интерпретируется как изменение перехвата. То есть ваш коэффициент дает вам разницу в перехвате, когда , т.е. когда , перехват равен . Эта интерпретация не меняется при добавлении квадрата . D = 1β3Dзнак равно1β 0 + β 3 x 1Dзнак равно1β0+β3Икс1

Теперь смысл добавления квадрата в ряд состоит в том, что вы предполагаете, что отношения стираются в определенный момент. Глядя на ваше второе уравнение

Yзнак равноβ0+β1Икс1+β2Икс12+β3D+ε

Принимая производную по доходностиИкс1

δYδИкс1знак равноβ1+2β2Икс1

Решение этого уравнения дает вам поворотный момент отношений. Как объяснил пользователь 1493368, это действительно отражает обратную U-образную форму, если и наоборот. Возьмите следующий пример:β1<0

Y^знак равно1,3+0,42Икс1-0,32Икс12+0,14D

Производная по равнаИкс1

δYδИкс1знак равно0,42-2*0,32Икс1

Решение для дает вамИкс1

δYδИкс1знак равно0Икс10,66

Это та точка, в которой отношения имеют свой поворотный момент. Вы можете взглянуть на вывод Wolfram-Alpha для вышеуказанной функции для некоторой визуализации вашей проблемы.

Помните, что при интерпретации эффекта при прочих равных условиях изменения на вы должны посмотреть на уравнение: гИкс1Y

ΔYзнак равно(β1+2β2Икс1)ΔИкс

То есть вы не можете интерпретировать изолированно, как только вы добавили квадратный регрессор !x 2 1β1Икс12

Относительно вашего незначительного после включения квадрата , это указывает на смещение неправильной спецификации.х 1DИкс1


Здравствуй. Если у вас было несколько предикторов, следует ли вам использовать частные производные или общие производные (дифференциальные)?
Скан

1
Частичная производная все еще является правильным путем. Интерпретация всех коэффициентов при прочих равных условиях , т. Е. Сохранение всего остального постоянным. Это именно то, что вы делаете, когда вы берете частную производную.
Altabq

Посмотрите эту страницу UCLA IDRE, чтобы дополнить отличный ответ @ altabq.
Сирил

19

Хорошим примером включения квадрата переменной является экономика труда. Если вы принимаете yкак заработную плату (или журнал заработной платы) и xкак возраст, то включение x^2означает, что вы проверяете квадратичное соотношение между возрастом и заработной платой. Заработная плата увеличивается с возрастом, поскольку люди становятся более опытными, но в более старшем возрасте заработная плата начинает увеличиваться с уменьшающейся скоростью (люди становятся старше, и они не будут настолько здоровы, чтобы работать, как раньше), и в какой-то момент заработная плата не растет ( достигает оптимального уровня заработной платы), а затем начинает падать (они уходят на пенсию и их заработок начинает уменьшаться). Таким образом, соотношение между заработной платой и возрастом перевернуто U-образно (эффект жизненного цикла). В целом, для примера, упомянутого здесь, ageожидается , что коэффициент будет положительным, а затемage^2быть отрицательным. Дело в том, что должно быть теоретическое обоснование / эмпирическое обоснование для включения квадрата переменной. Здесь фиктивная переменная может рассматриваться как представляющая пол работника. Вы также можете включить термин взаимодействия пола и возраста, чтобы проверить, зависит ли разница между полами от возраста.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.