Я постараюсь ответить на мягкое побуждение whuber просто «ответить на вопрос» и остаться в теме. Нам дают 144 ежемесячных чтения серии под названием «Серия авиакомпаний». Бокс и Дженкинс были широко раскритикованы за то, что они предоставили прогноз, который был дико на высокой стороне из-за "взрывной природы" обратного зарегистрированного преобразования.
Визуально у нас создается впечатление, что дисперсия исходного ряда увеличивается с уровнем ряда, что указывает на необходимость преобразования. Однако мы знаем, что одним из требований для полезной модели является то, что дисперсия «ошибок модели» должна быть однородной. Не требуется никаких предположений относительно дисперсии исходного ряда. Они идентичны, если модель является просто константой, т. Е. Y (t) = u. Как /stats//users/2392/probabilityislogic так ясно заявил в своем ответе на Совет по объяснению гетерогенности / гетероскедастичности «одна вещь, которую я всегда нахожу забавной, - это« ненормальность данных », которую люди волнуются около. Данные не должны быть нормально распределены, но термин ошибки делает »
Ранние работы во временных рядах часто ошибочно приводили к выводам о необоснованных преобразованиях. Здесь мы обнаружим, что исправительным преобразованием для этих данных является просто добавление трех фиктивных рядов индикаторов в модель ARIMA, отражающих корректировку для трех необычных точек данных. Ниже приведен график функции автокорреляции, предполагающий сильную автокорреляцию при лаге 12 (0,76) и лаге 1 (0,948). Автокорреляции - это просто коэффициенты регрессии в модели, где y - это зависимая переменная, прогнозируемая с запаздыванием y.
!
Вышеприведенный анализ предполагает, что одна модель моделирует первые различия серии и изучает эту «остаточную серию», которая идентична первым различиям в первую очередь по своим свойствам.
Этот анализ подтверждает идею о том, что в данных существует сильная сезонная картина, которую можно исправить или смоделировать с помощью модели, содержащей два оператора дифференцирования.
Эта простая двойная разность дает набор невязок, то есть скорректированных рядов или, если говорить в произвольной форме, преобразованный ряд, который свидетельствует о непостоянной дисперсии, но причиной непостоянной дисперсии является непостоянное среднее значение невязки. Вот график дважды дифференцированный ряд, предполагающий три аномалии в конце ряда. Автокорреляция этой серии ложно указывает, что «все хорошо», и может потребоваться любая настройка Ma (1). Следует проявлять осторожность, поскольку в данных есть предположения об аномалиях, поэтому акф смещен вниз. Это известно как «Эффект Алисы в Стране Чудес», т. Е. Принятие нулевой гипотезы об отсутствии доказанной структуры, когда эта структура маскируется нарушением одного из предположений.
Мы визуально обнаруживаем три необычные точки (117 135 136)
Этот этап обнаружения выбросов называется обнаружением вмешательства и может быть легко или не так легко запрограммирован в соответствии с работой Цая.
Если мы добавим три показателя в модель, мы получим
Затем мы можем оценить
И получить участок остатков и акф
Это позволяет предположить, что мы добавляем в модель потенциально два коэффициента скользящего среднего. Таким образом, следующая оценочная модель может быть.
Уступая
Затем можно удалить несущественную константу и получить уточненную модель:
Мы отмечаем, что никакие степенные преобразования не требовались вообще, чтобы получить набор невязок с этой постоянной дисперсией. Обратите внимание, что прогнозы не являются взрывоопасными.
В терминах простой взвешенной суммы мы имеем: 13 весов; 3 ненулевое и равно (1.0.1,0., - 1.0)
Этот материал был представлен таким образом, что он не был автоматическим и, следовательно, требовал взаимодействия с пользователем при принятии решений по моделированию.