Что означают нормальные остатки и что это говорит мне о моих данных?


13

Довольно простой вопрос:

Что означает нормальное распределение остатков от линейной регрессии? С точки зрения того, как это отражается на моих исходных данных регрессии?

Я в полном замешательстве, спасибо, ребята

Ответы:


5

β0β1

E[Y|X]=β0+β1X
YX

YXYXX

YE[Y|X]XYβ0+β1XE[Y|X]ϵ

Y=E[Y|X]+ϵ

Короче говоря: это нормальное распределение представляет изменчивость вашего результата на вершине изменчивости, объясненной моделью.

YX

Примечание: я обосновал линейную регрессию одним предиктором, но то же самое можно сказать и о большем: просто замените «линию» на «гиперплоскость» выше.


Это отличное объяснение! Однако один вопрос: если e нормально распределен, это означает, что вы предполагаете, что наиболее вероятные значения e находятся в диапазоне от -1 до +1 (после того, как они были стандартизированы)? Таким образом, вы в основном используете нормальное распределение вместо, скажем, распределения Пуассона, потому что нормальное распределение лучше моделирует, как эти значения ведут себя в реальной жизни?
user3813234

1

Это может много значить или ничего не значить. Если вы подходите модели, чтобы получить самый высокий R-квадрат, это может означать, что вы были глупы. Если вы подходите для того, чтобы модель была скупой в том смысле, что переменные необходимы и необходимы, и вы заботитесь о выявлении выбросов, то вы хорошо поработали. Посмотрите здесь для получения дополнительной информации по этому http://www.autobox.com/cms/index.php?option=com_content&view=article&id=175


0

Нормальность остатков - это предположение о работе линейной модели. Таким образом, если ваши остатки нормальны, это означает, что ваше предположение является верным, и вывод модели (доверительные интервалы, прогнозирование модели) также должен быть действительным. Это так просто!


Предположение о нормальности относится к ненаблюдаемой ошибке (отсюда необходимость допущения), а не к наблюдаемым невязкам.
DL Dahly

2
Да, но вы используете остатки для проверки вашего предположения о ненаблюдаемой ошибке.
wcampbell

 to 
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.