У меня есть временной ряд, который я пытаюсь прогнозировать, для которого я использовал сезонную модель ARIMA (0,0,0) (0,1,0) [12] (= fit2). Это отличается от того, что R предложил с auto.arima (R-вычисленный ARIMA (0,1,1) (0,1,0) [12] был бы более подходящим, я назвал его fit1). Тем не менее, в последние 12 месяцев моего временного ряда моя модель (fit2) кажется более подходящей при корректировке (она была хронически смещена, я добавил остаточное среднее, и новая подгонка, кажется, более плотно прилегает к исходному временному ряду Вот пример последних 12 месяцев и MAPE за 12 самых последних месяцев для обоих приступов:
Временной ряд выглядит так:
Все идет нормально. Я выполнил остаточный анализ для обеих моделей, и здесь есть путаница.
ACF (остаток (fit1)) выглядит отлично, очень белый шум:
Однако тест Льюнга-Бокса не выглядит хорошим, например, для 20 лагов:
Box.test(resid(fit1),type="Ljung",lag=20,fitdf=1)
Я получаю следующие результаты:
X-squared = 26.8511, df = 19, p-value = 0.1082
Насколько я понимаю, это подтверждение того, что остатки не являются независимыми (значение р слишком велико, чтобы оставаться в гипотезе независимости).
Однако для лаг 1 все отлично:
Box.test(resid(fit1),type="Ljung",lag=1,fitdf=1)
дает мне результат:
X-squared = 0.3512, df = 0, p-value < 2.2e-16
Либо я не понимаю тест, либо это немного противоречит тому, что я вижу на графике acf. Автокорреляция смехотворно низкая.
Затем я проверил fit2. Функция автокорреляции выглядит следующим образом:
Несмотря на такую очевидную автокорреляцию при нескольких первых лагах, тест Льюнга-Бокса дал мне гораздо лучшие результаты при 20 лагах, чем fit1:
Box.test(resid(fit2),type="Ljung",lag=20,fitdf=0)
результаты в:
X-squared = 147.4062, df = 20, p-value < 2.2e-16
тогда как только проверка автокорреляции на lag1 также дает мне подтверждение нулевой гипотезы!
Box.test(resid(arima2.fit),type="Ljung",lag=1,fitdf=0)
X-squared = 30.8958, df = 1, p-value = 2.723e-08
Я правильно понимаю тест? Значение p предпочтительно должно быть меньше 0,05, чтобы подтвердить нулевую гипотезу независимости от остатков. Какую посадку лучше использовать для прогнозирования, fit1 или fit2?
Дополнительная информация: остатки fit1 отображают нормальное распределение, а остатки fit2 - нет.
X-squared
) увеличивается по мере того, как выборочные автокорреляции остатков увеличиваются (см. Его определение), а его значение p представляет собой вероятность получения значения, равного или превышающего значение, наблюдаемое при нулевом значении Гипотеза о том, что истинные инновации являются независимыми. Поэтому небольшое значение р свидетельствует против независимости.
fitdf
), поэтому вы проверяли распределение хи-квадрат с нулевыми степенями свободы.