Интерпретация модели ARIMA


19

У меня есть вопрос о моделях ARIMA. Допустим, у меня есть временной ряд который я хотел бы спрогнозировать, и модель кажется хорошим способом выполнить прогнозирование. Теперь отстающие означают, что мои сегодняшние сериалы находятся под влиянием предыдущих событий. Это имеет смысл. Но какова интерпретация ошибок? Мой предыдущий остаток (насколько я был в моих вычислениях) влияет на стоимость моей серии сегодня? Как рассчитываются отставшие остатки в этой регрессии, поскольку она является продуктом / остатком регрессии?YtARIMA(2,2)

ΔYt=α1ΔYt1+α2ΔYt2+νt+θ1νt1+θ2νt2
Y

4
Я думаю, что вы должны помнить, что модели ARIMA являются атеоретическими моделями, поэтому обычные правила интерпретации оценочных коэффициентов регрессии строго не применяются одинаково. Модели ARIMA имеют определенные особенности, о которых следует знать. Например, чем ниже значения α1 в AR (1), тем быстрее скорость сходимости. Но, например, модель AR (2). Не все модели AR (2) одинаковы! Например, если условие (α12+4α2<0) удовлетворяется, тогда AR (2) отображает псевдопериодическое поведение, и в результате его прогнозы являются стохастическими циклами.
Грэм Уолш

3
(продолжение ...) В некоторой степени аналогичным образом, когда речь идет о векторных авторегрессиях, мы склонны интерпретировать функции импульсной характеристики (IRF), а не оцененные коэффициенты; коэффициенты часто слишком сложны для интерпретации, но обычно можно понять смысл IRF. Из любопытства, вы нашли много работ, в которых автор (ы) уделял много внимания интерпретации коэффициентов в модели ARIMA?
Грэм Уолш

2
Кажется, существует проблема обозначений. " » не может быть правым, поскольку модели ARIMA имеют три термина ( p , d , q ) для каждого из компонентов AR / I / MA соответственно, в то время как модели ARMA имеют два (например, ARMA ( 2 , 2 ) ) - но у вас, кажется, есть первое различие, которое предполагает, что вы имеете в виду ARIMA ( 2 , 1 , 2 ) . Пожалуйста, измените, чтобы отразить ваше намерение. ARIMA(2,2)(п,d,Q)ARMA(2,2)ARIMA(2,1,2)
Glen_b

2
@Glen_b Я помню, что задавал то же самое по другому вопросу . Оказывается, у нас есть своего рода дублирование. Настоящий вопрос и связанный с ним очень похожи.
Грэм Уолш

Ответы:


36

Я думаю, что вы должны помнить, что модели ARIMA являются атеоретическими моделями, поэтому обычный подход к интерпретации оценочных коэффициентов регрессии в действительности не переносится на моделирование ARIMA.

Чтобы интерпретировать (или понять) оцененные модели ARIMA, было бы хорошо знать различные функции, отображаемые рядом общих моделей ARIMA.

Мы можем исследовать некоторые из этих функций, изучая типы прогнозов, создаваемых различными моделями ARIMA. Это основной подход, который я использовал ниже, но хорошей альтернативой было бы рассмотреть функции импульсной характеристики или динамические временные траектории, связанные с различными моделями ARIMA (или стохастическими разностными уравнениями). Я поговорю об этом в конце.

AR (1) Модели

Давайте рассмотрим модель AR (1) на мгновение. В этой модели можно сказать, что чем ниже значение тем быстрее скорость сходимости (к среднему значению). Мы можем попытаться понять этот аспект моделей AR (1), исследуя природу прогнозов для небольшого набора моделируемых моделей AR (1) с различными значениями для α 1 .α1α1

Множество четырех AR (1) моделей, которые мы обсудим, можно записать в алгебраической записи как: где C - постоянная, а остальная часть обозначений следует из OP. Как видно, каждая модель отличается только по значению α 1 .

YTзнак равноС+0,95YT-1+νT                               (1)YTзнак равноС+0.8YT-1+νT                                (2)YTзнак равноС+0,5YT-1+νT                                (3)YTзнак равноС+0,4YT-1+νT                                (4)
Сα1

На графике ниже я составил прогнозы вне выборки для этих четырех моделей AR (1). Можно видеть, что прогнозы для модели AR (1) с сходятся с более медленной скоростью по сравнению с другими моделями. Прогнозы для модели AR (1) с α 1 = 0,4 сходятся с большей скоростью, чем другие.α1знак равно0,95α1знак равно0,4

введите описание изображения здесь

Примечание: когда красная линия горизонтальна, она достигла среднего значения моделируемой серии.

MA (1) Модели

θ1

YTзнак равноС+0,95νT-1+νT                               (5)YTзнак равноС+0.8νT-1+νT                                (6)YTзнак равноС+0,5νT-1+νT                                (7)YTзнак равноС+0,4νT-1+νT                                (8)

На графике ниже я построил внеплановые прогнозы для этих четырех разных моделей MA (1). Как показывает график, поведение прогнозов во всех четырех случаях заметно схоже; быстрая (линейная) сходимость к среднему. Обратите внимание, что динамика этих прогнозов менее разнообразна по сравнению с моделями AR (1).

введите описание изображения здесь

Примечание: когда красная линия горизонтальна, она достигла среднего значения моделируемой серии.

AR (2) модели

Все становится намного интереснее, когда мы начинаем рассматривать более сложные модели ARIMA. Возьмем для примера модели AR (2). Это всего лишь маленький шаг по сравнению с моделью AR (1), верно? Что ж, можно подумать об этом, но динамика моделей AR (2) достаточно разнообразна, как мы увидим ниже.

Давайте рассмотрим четыре разные модели AR (2):

YTзнак равноС+1,7YT-1-0.8YT-2+νT                               (9)YTзнак равноС+0.9YT-1-0.2YT-2+νT                                (10)YTзнак равноС+0,5YT-1-0.2YT-2+νT                                (11)YTзнак равноС+0,1YT-1-0,7YT-2+νT                                (12)

Прогнозы вне выборки, связанные с каждой из этих моделей, показаны на графике ниже. Совершенно очевидно, что каждый из них значительно различается, и они также довольно разнообразны по сравнению с прогнозами, которые мы видели выше - за исключением прогнозов модели 2 (верхний правый график), которые ведут себя аналогично прогнозам для AR (1) модель.

введите описание изображения здесь

Примечание: когда красная линия горизонтальна, она достигла среднего значения моделируемой серии.

α12+4α2<0,

Стоит отметить, что указанное выше условие вытекает из общего решения однородной формы линейного автономного разностного уравнения второго порядка (со сложными корнями). Если это вам чуждо, я рекомендую и главу 1 Гамильтона (1994), и главу 20 Хой и соавт. (2001).

(1,7)2+4(-0.8)знак равно-0,31<0                               (13)(0.9)2+4(-0.2)знак равно0,01>0                                 (14)(0,5)2+4(-0.2)знак равно-0,55<0                               (15)(0,1)2+4(-0,7)знак равно-2,54<0                               (16)

Как и ожидалось из-за появления построенных прогнозов, условие выполняется для каждой из четырех моделей, за исключением модели 2. Как видно из графика, прогнозы модели 2 ведут себя («нормально») подобно прогнозам модели AR (1). Прогнозы, связанные с другими моделями, содержат циклы.

Приложение - Моделирование инфляции

πT

πTзнак равноС+α1πT-1+α2πT-2+νT,
, Я бы не стал спорить с такой интерпретацией, но я бы предложил проявить некоторую осторожность и чтобы нам пришлось копать глубже, чтобы разработать правильную интерпретацию. В этом случае мы могли бы спросить, каким образом инфляция связана с предыдущими уровнями инфляции? Есть ли циклы? Если да, сколько там циклов? Можем ли мы что-то сказать о пике и впадине? Как быстро прогнозы сходятся к среднему? И так далее.

Это те вопросы, которые мы можем задать, пытаясь интерпретировать модель AR (2), и, как вы можете видеть, это не так просто, как взятие оценочного коэффициента и высказывание «увеличение этой переменной на 1 единицу связано с увеличение во многих единицах зависимой переменной » - конечно, при условии, что условие « при прочих равных условиях » присоединяется к этому утверждению.

Имейте в виду, что в нашем обсуждении мы рассмотрели только выбор моделей AR (1), MA (1) и AR (2). Мы даже не смотрели на динамику смешанных моделей ARMA и моделей ARIMA с более высокой задержкой.

α2

πTзнак равноС+α1πT-1+α3πT-3+θ1νT-1+νT,

Скажите, что хотите, но здесь лучше попытаться понять динамику самой системы. Как и прежде, мы можем посмотреть и посмотреть, какие прогнозы дает модель, но альтернативный подход, о котором я упоминал в начале этого ответа, заключался в том, чтобы посмотреть на функцию импульсного отклика или временной путь, связанный с системой.

Это подводит меня к следующей части моего ответа, где мы обсудим функции импульсного отклика.

Функции импульсного отклика

Те, кто знаком с векторной авторегрессией (VAR), будут знать, что обычно пытаются понять оценочную модель VAR, интерпретируя функции импульсного отклика; вместо того, чтобы пытаться интерпретировать оценочные коэффициенты, которые зачастую слишком сложно интерпретировать в любом случае.

Тот же подход может быть использован при попытке понять модели ARIMA. То есть вместо того, чтобы пытаться разобраться в (сложных) заявлениях типа «сегодняшняя инфляция зависит от вчерашней инфляции и инфляции двухмесячной давности, но не от инфляции прошлой недели!» вместо этого мы строим функцию импульсного отклика и пытаемся понять это.

Приложение - четыре макропеременные

YTзнак равно3,20+0,22YT-1+0,15YT-2+νTπTзнак равно4,10+0,46πT-1+0,31πT-2+0,16πT-3+0,01πT-4+νTUTзнак равно6,2+1,58UT-1-0,64UT-2+νTрTзнак равно6,0+1,18рT-1-0,23рT-2+νT
YTTπUр

Уравнения показывают, что рост ВВП, уровень безработицы и краткосрочная процентная ставка моделируются как процессы AR (2), а инфляция моделируется как процесс AR (4).

Вместо того, чтобы пытаться интерпретировать коэффициенты в каждом уравнении, давайте построим функции импульсного отклика (IRF) и вместо этого интерпретируем их. На графике ниже показаны функции импульсного отклика, связанные с каждой из этих моделей.

введите описание изображения здесь

Не воспринимайте это как мастер-класс по интерпретации IRF - думайте об этом больше как о базовом введении - но в любом случае, чтобы помочь нам интерпретировать IRF, нам нужно привыкнуть к двум концепциям; импульс и настойчивость .

Эти два понятия определены в Leamer (2010) следующим образом:

Импульс : Импульс - это тенденция продолжать движение в том же направлении. Эффект импульса может компенсировать силу регрессии (конвергенции) к среднему значению и может позволить переменной отойти от своего исторического среднего значения на некоторое время, но не на неопределенное время.

Постоянство : переменная постоянства будет зависеть от того, где она есть, и медленно сходиться только к историческому значению

Оборудованный этими знаниями, мы теперь задаем вопрос: предположим, что переменная находится в своем историческом среднем значении и получает временный шок на одну единицу за один период, как переменная будет реагировать в будущих периодах? Это все равно, что задавать те вопросы, которые мы задавали ранее, например, содержат ли прогнозы циклы? , Как быстро делать прогнозы сходятся к среднему значению? , и т.д.

Наконец, теперь мы можем попытаться интерпретировать IRF.

После шока в одну единицу уровень безработицы и краткосрочная процентная ставка (3-месячная казна) переносятся дальше от их исторического среднего значения. Это импульсный эффект. IRF также показывают, что уровень безработицы превышает в большей степени, чем краткосрочная процентная ставка.

Мы также видим, что все переменные возвращаются к своим историческим средствам (ни одна из них не «взрывается»), хотя каждая из них делает это с разной скоростью. Например, рост ВВП возвращается к своему историческому среднему значению примерно через 6 периодов после шока, уровень безработицы возвращается к своему историческому среднему значению примерно через 18 периодов, но инфляция и краткосрочные проценты занимают более 20 периодов, чтобы вернуться к своим историческим значениям. В этом смысле рост ВВП является наименее стойким из четырех переменных, в то время как инфляцию можно назвать очень стойкой.

Я думаю, что было бы справедливо сказать, что нам удалось (хотя бы частично) понять, что четыре модели ARIMA говорят нам о каждой из четырех макропеременных.

Вывод

Вместо того, чтобы пытаться интерпретировать оценочные коэффициенты в моделях ARIMA (сложно для многих моделей), вместо этого попытайтесь понять динамику системы. Мы можем попытаться сделать это, изучив прогнозы, сделанные нашей моделью, и построив график функции импульсного отклика.

[Я достаточно рад поделиться своим R-кодом, если кто-то захочет.]

Ссылки

  • Гамильтон, JD (1994). Анализ временных рядов (Том 2). Принстон: издательство Принстонского университета.
  • Leamer, E. (2010). Макроэкономические модели и истории - Руководство для MBA, Springer.
  • Стенгос, Т., Хой, Дж. Ливернуа, К. МакКенна и Р. Рис (2001). Математика для экономики, 2-е издание, MIT Press: Cambridge, MA.

3
Люблю применение IRF для не VAR. Они всегда кажутся связанными, и я никогда не думал об использовании IRF на простых ARIMA. (Это плюс, кто действительно может понять, что делают термины МА?)
Уэйн

2
Какой отличный ответ!
Ричард Харди

9

MA()

ΔYTзнак равноΣJзнак равно0ψJνT-J

MA(1)Aр(1)

YTзнак равноνT+θ1νT-1

YTзнак равноρYT-1+νTзнак равноνT+ρνT-1+ρ2νT-1+,,,

Вы можете сказать, что термины ошибки в моделях ARMA объясняют «краткосрочное» влияние прошлого, а запаздывающие термины объясняют «долгосрочное» влияние. Сказав, что я не думаю, что это очень помогает, и обычно никто не беспокоится о точной интерпретации коэффициентов ARMA. Цель обычно состоит в том, чтобы получить адекватную модель и использовать ее для прогнозирования.


+1 Это более или менее то, что я пытался получить в моих комментариях выше.
Грэм Уолш

Ха, я не видел твоих комментариев, когда писал ответ. Я предлагаю преобразовать их в ответ.
mpiktas

8

Nс1,с2,,,,,сN

Y(T)знак равнос1Y(T-1)+с2Y(T-2)+с3Y(T-3)+,,,+сNY(T-N)+a(T)

Таким образом модель ARIMA может быть объяснена как ответ на вопрос

  1. Сколько исторических ценностей я должен использовать, чтобы вычислить взвешенную сумму прошлого?
  2. Что это за ценности?
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.