Я пытаюсь понять происхождение изогнутой формы доверительных полос, связанных с линейной регрессией OLS, и как это относится к доверительным интервалам параметров регрессии (наклон и перехват), например (с использованием R):
require(visreg)
fit <- lm(Ozone ~ Solar.R,data=airquality)
visreg(fit)
Похоже, что полоса связана с границами линий, рассчитанными с перехватом 2,5%, с наклоном 97,5%, а также с перехватом 97,5% и с наклоном 2,5% (хотя и не совсем):
xnew <- seq(0,400)
int <- confint(fit)
lines(xnew, (int[1,2]+int[2,1]*xnew))
lines(xnew, (int[1,1]+int[2,2]*xnew))
Что я не понимаю, так это две вещи:
- Как насчет комбинации наклона 2,5% и перехвата 2,5%, а также наклона 97,5% и перехвата 97,5%? Они дают линии, которые явно находятся за пределами полосы, изображенной выше. Может быть, я не понимаю значения доверительного интервала, но если в 95% случаев мои оценки находятся в пределах доверительного интервала, это кажется возможным результатом?
- Что определяет минимальное расстояние между верхним и нижним пределами (т. Е. Близко к точке, где пересекаются две добавленные выше линии)?
Я предполагаю, что оба вопроса возникают, потому что я не знаю / не понимаю, как эти группы фактически рассчитаны.
Как я могу рассчитать верхний и нижний пределы, используя доверительные интервалы параметров регрессии (не полагаясь на предикат () или аналогичную функцию, т.е. вручную)? Я пытался расшифровать функцию предиката l в R, но кодирование мне не под силу. Буду признателен за любые ссылки на соответствующую литературу или объяснения, подходящие для начинающих статистики.
Спасибо.