Я заинтересован в выборе модели в настройке временных рядов. Для конкретности предположим, что я хочу выбрать модель ARMA из пула моделей ARMA с различными порядками запаздывания. Конечная цель - прогнозирование .
Выбор модели может быть сделан
- перекрестная проверка,
- использование информационных критериев (AIC, BIC),
среди других методов.
Роб Дж. Хиндман предоставляет способ перекрестной проверки временных рядов . Для сравнительно небольших выборок размер выборки, используемый при перекрестной проверке, может качественно отличаться от исходного размера выборки. Например, если исходный размер выборки составляет 200 наблюдений, можно подумать о начале перекрестной проверки, взяв первые 101 наблюдение и расширив окно до 102, 103, ..., 200 наблюдений, чтобы получить 100 результатов перекрестной проверки. Ясно, что модель, которая достаточно экономна для 200 наблюдений, может быть слишком большой для 100 наблюдений, и, следовательно, ее ошибка валидации будет большой. Таким образом, перекрестная проверка, вероятно, будет систематически отдавать предпочтение слишком экономным моделям. Это нежелательный эффект из-за несоответствия размеров выборки .
Альтернативой перекрестной проверке является использование информационных критериев для выбора модели. Поскольку я забочусь о прогнозировании, я бы использовал AIC. Даже при том, что AIC асимптотически эквивалентен минимизации одноэтапного прогноза MSE для моделей временных рядов (согласно этому посту Робом Дж. Хиндманом), я сомневаюсь, что это уместно здесь, так как выборка размеры, о которых я забочусь, не такие большие ...
Вопрос: я должен выбрать AIC по перекрестной проверке временных рядов для малых / средних выборок?
Несколько связанных вопросов можно найти здесь , здесь и здесь .