Почему не нормально распределенные ошибки ставят под угрозу достоверность наших утверждений о значимости?


10

При рассмотрении моделей OLS существует предположение о нормальности, а именно то, что ошибки распределяются нормально. Я просматривал Cross Validated, и кажется, что Y и X не должны быть нормальными, чтобы ошибки были нормальными. Мой вопрос заключается в том, почему, когда у нас есть ошибки, которые обычно не распределяются, действительность наших утверждений о значимости ставится под угрозу? Почему доверительные интервалы будут слишком широкими или узкими?

Ответы:


9

почему, когда у нас есть ненормально распределенные ошибки, достоверность наших утверждений о значимости ставится под угрозу? Почему доверительные интервалы будут слишком широкими или узкими?

Доверительные интервалы основаны на том, как числитель и знаменатель распределены в t-статистике.

При нормальных данных числитель t-статистики имеет нормальное распределение, а распределение квадрата знаменателя (которое тогда является дисперсией) является определенным кратным распределения хи-квадрат. Когда числитель и знаменатель также независимы (как это будет иметь место только с обычными данными, учитывая, что сами наблюдения являются независимыми), вся статистика имеет t-распределение.

β^-βsβ^βT

Если бы данные были из какого-то другого распределения, статистика не имела бы t-распределения. Например, если бы это был тяжелый хвост, то распределение t было бы немного более легким (отдаленные наблюдения влияют на знаменатель больше, чем на числитель). Вот пример. В обоих случаях гистограмма рассчитана на 10 000 регрессий:

введите описание изображения здесь

βзнак равно0(-2,2)

Т-интервал 95% (который должен включать 95% уклонов в нашей выборке) составляет от -2,048 до 2,048. Для нормальных данных он фактически включал 95,15% от 10000 выборочных уклонов. Для искаженных данных это включает 99,91%.


Какой дистрибутив вы использовали для асимметричной версии?
gung - Восстановить Монику

2
T
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.