Переменные и X 2 не являются линейно независимыми. Таким образом , даже если не существует квадратичный эффект, добавление X 2 модели будет изменять оценочную эффект X .ИксИкс2Икс2Икс
Давайте посмотрим на очень простую симуляцию.
> x <- runif(1e3)
> y <- x + rnorm(length(x))
> summary(lm(y~x))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.03486 0.06233 -0.559 0.576
x 1.05843 0.10755 9.841 <2e-16 ***
Теперь с квадратичным членом в модели, чтобы соответствовать.
> summary(lm(y~x+I(x^2)))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.03275 0.09528 0.344 0.731
x 0.65742 0.44068 1.492 0.136
I(x^2) 0.39914 0.42537 0.938 0.348
Конечно, комплексный тест все еще важен, но я думаю, что результат, который мы ищем, не этот. Решение состоит в том, чтобы использовать ортогональные полиномы.
> summary(lm(y~poly(x,2)))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.49744 0.03098 16.059 <2e-16 ***
poly(x, 2)1 9.63943 0.97954 9.841 <2e-16 ***
poly(x, 2)2 0.91916 0.97954 0.938 0.348
Обратите внимание, что коэффициенты x
в первой модели и poly(x,2)1
во второй модели не равны, и даже точки пересечения различны. Это потому, что poly
доставляет ортонормированные векторы, которые также ортогональны к вектору rep(1, length(x))
. Так poly(x,2)1
нет, x
а скорее (x -mean(x))/sqrt(sum((x-mean(x))**2))
...
Важным моментом является то, что тесты Вальда в этой последней модели независимы. Вы можете использовать ортогональные полиномы, чтобы решить, до какой степени вы хотите пойти, просто взглянув на тест Вальда: здесь вы решаете оставить а не X 2 . Конечно, вы могли бы найти ту же модель, сравнив первые две подходящие модели, но так проще - если вы решите подняться на более высокие ступени, это действительно намного проще.ИксИкс2
После того, как вы решили, какие термины сохранить, вы можете вернуться к необработанным полиномам и X 2 для интерпретации или прогнозирования.ИксИкс2