Я прочитал много отличных обсуждений на сайте относительно интерпретации доверительных интервалов и интервалов прогнозирования, но одна концепция все еще немного озадачивает:
Рассмотрим структуру OLS, и мы получили подходящую модель . Нам дали и попросили предсказать его ответ. Мы вычисляем и, в качестве бонуса, мы также предоставляем интервал прогнозирования 95% вокруг нашего прогноза, в виде получения формулы для пределов прогнозирования в линейной модели . Давайте назовем этот интервал прогнозирования PI.
Теперь, что из следующего (или ни одного) является правильной интерпретацией PI?
- В частности, для лежит в пределах PI с вероятностью 95%.
- Если нам дадут большое количество s, эта процедура для вычисления PI будет покрывать истинные ответы в 95% случаев.
Из формулировки @ gung в интервале прогнозирования линейной регрессии кажется, что первое верно (хотя я вполне мог бы неправильно истолковать его). Интерпретация 1 кажется мне нелогичной (в том смысле, что мы делаем байесовские выводы из частотного анализа), но если это правильно, это потому , что мы предсказывали на реализацию случайной величины VS. оценивающего с параметром ?
(Изменить) Бонусный вопрос: предположим, что мы знали, что такое истинная , то есть процесс, генерирующий данные, тогда сможем ли мы говорить о вероятностях в отношении какого-либо конкретного прогноза, поскольку мы просто смотрим на ?
Моя последняя попытка сделать это: мы можем «концептуально разложить» (используя слово очень свободно) интервал прогнозирования на две части: (A) доверительный интервал вокруг предсказанного среднего ответа и (B) набор интервалов, которые являются просто квантильными диапазоны погрешности. (B) мы можем делать вероятностные заявления, при условии, что мы знаем истинное прогнозируемое среднее, но в целом мы можем рассматривать интервалы прогнозирования как частые КИ вокруг прогнозируемых значений. Это несколько правильно?