Разница между прогнозами «в выборке» и «псевдо вне выборки»


12

Есть ли явная разница между прогнозами в выборке и псевдо прогнозами вне выборки . И то, и другое подразумевается в контексте оценки и сравнения моделей прогнозирования.

Ответы:


18

Предположим , у вас есть данные , где ч { 1 , 2 , ... } , и ваша цель состоит в том, чтобы построить модель (скажем, е ( Х т - ч ) ) для прогнозирования Y t с учетом X t - h . Для конкретности предположим, что данные являются ежедневными, а T соответствует сегодняшнему дню.{Yt,Xth}t=h+1Th{1,2,},f^(Xth)YtXthT

Под анализом выборки подразумевается оценка модели с использованием всех доступных данных до включительно , а затем сравнение подгоночных значений модели с фактическими реализациями. Однако известно, что эта процедура рисует чрезмерно оптимистичную картину способности прогнозирования модели, поскольку общие алгоритмы подбора (например, с использованием квадратов ошибок или критериев вероятности), как правило, стараются избежать больших ошибок прогнозирования и, таким образом, подвержены переобучению - ошибочному шуму. для сигнала в данных.T

YT+1eT+1YT+1f^(XT+1h),YT+2{eT+l}l=1L

T0<TT{et}t=T0+1T

Обратите внимание, что псевдо-анализ вне выборки не единственный способ оценить производительность модели вне выборки. Альтернативы включают перекрестную проверку и информационные критерии.

Очень хорошее обсуждение всех этих вопросов приводится в главе 7

http://www.stanford.edu/~hastie/local.ftp/Springer/OLD/ESLII_print4.pdf


3
Ссылка в формате PDF не работает, но, похоже, это бесплатная онлайн-книга
Олег Мельников,
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.