Хорошо известно, по крайней мере среди статистиков более высокого уровня, что модели со значениями статистики AIC в пределах определенного порога минимального значения следует рассматривать как соответствующие модели, минимизирующей статистику AIC. Например, в [1, с.221] находим
Тогда модели с маленьким GCV или AIC будут считаться лучшими. Конечно, нельзя просто слепо минимизировать GCV или AIC. Скорее, все модели с достаточно малыми значениями GCV или AIC следует рассматривать как потенциально подходящие и оценивать в соответствии с их простотой и научной значимостью.
Аналогично, в [2, с.144] мы имеем
Было предложено (Duong, 1984), что модели со значениями AIC в пределах c минимального значения должны считаться конкурентоспособными (с c = 2 в качестве типичного значения). Выбор из конкурирующих моделей может быть основан на таких факторах, как белизна остатков (раздел 5.3) и простота модели.
Рекомендации:
- Ruppert, D .; Wand, MP & Carrol, RJ Semiparametric Regression , Cambridge University Press, 2003
- Броквелл, PJ & Davis, RA Введение в временные ряды и прогнозирование , John Wiley & Sons, 1996
Итак, учитывая вышесказанное, какая из двух моделей ниже должна быть предпочтительной?
print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787: log likelihood = -27.09, aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975: log likelihood = -29.38, aic = 64.76
В более общем случае, когда уместно выбирать модели путем слепого минимизации AIC или связанной статистики?