Что на самом деле вычисляет формула y ~ x + 0 в R?


11

Какова статистическая разница между выполнением линейной регрессии в R с formulaнабором y ~ x + 0вместо y ~ x? Как мне интерпретировать эти два разных результата?

Ответы:


18

Добавление +0(или -1) к модельной формуле (например, в lm()) в R подавляет перехват. Обычно это считается плохой вещью; видеть:

Предполагаемый наклон рассчитывается по-разному в зависимости от того, оценивается ли пересечение, а именно:

(with intercept)β^1=xiyi(xi)(yi)Nxi2(xi)2N(without intercept)β^1=xiyixi2

0

R2

Вот основные формулы:

(with intercept)R2=1(yiy^i)2(yiy¯)2(without intercept)R2=1(yiy^i)2yi2

Спасибо, блин! Если я подавляю перехват, мой множественный R-квадрат внезапно улучшается. Вы можете помочь мне здесь?
ДжимБой

6
Не существует согласованного способа вычисления r в квадрате без перехвата. Квадрат не имеет своей обычной интерпретации. Выполнение регрессии без перехвата почти всегда является ОЧЕНЬ плохой идеей
Repmat

@Repmat: смотри также stats.stackexchange.com/questions/171240/...


5

Это зависит от контекста (конечно), в lm(...)команде в R он будет подавлять перехват. То есть вы делаете регресс, хотя происхождение.

Обратите внимание, что большинство учебников по предмету регрессии скажут вам, что форсирование перехвата (с любым значением) - плохая идея.

Интерпретация x не меняется, но значение (по сравнению с и без перехвата) изменится, иногда очень значительно.


Спасибо, Репмат! Я получаю очень разные оценки, если я подавляю перехват по сравнению с тем, когда я не делаю. Кроме того, все t-тесты становятся очень значимыми. Ты знаешь почему это?
ДжимБой,

2
Перехват будет поглощать любые переменные, отличные от 0, не содержащиеся в модели. С прекращением перехвата, дисперсия должна куда-то уходить. Вот почему в большинстве книг, как правило, говорится, что регрессия без перехвата всегда неверна. Таким образом, в этом случае OLS всегда является предвзятым и непротиворечивым (за некоторыми исключениями).
Repmat
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.