Когда регистрировать преобразование временного ряда перед установкой модели ARIMA


26

Ранее я использовал прогноз Pro для прогнозирования одномерных временных рядов, но переключаю свой рабочий процесс на R. Пакет прогноза для R содержит много полезных функций, но он не выполняет никаких преобразований данных перед запуском auto. .arima (). В некоторых случаях прогноз Pro решает записать данные преобразования, прежде чем делать прогнозы, но я еще не выяснил, почему.

Итак, мой вопрос: когда я должен преобразовывать свои временные ряды, прежде чем пытаться использовать методы ARIMA?

/ edit: после прочтения ваших ответов я собираюсь использовать что-то вроде этого, где x - мой временной ряд:

library(lmtest)
if ((gqtest(x~1)$p.value < 0.10) {
    x<-log(x)
}

Имеет ли это смысл?

Ответы:


21

Некоторые предостережения, прежде чем продолжить. Как я часто предлагаю своим студентам, используйте auto.arima()вещи только в качестве первого приближения к вашему окончательному результату или если вы хотите иметь скупую модель, когда вы проверяете, что ваша модель, основанная на теории соперника, работает лучше.

Данные

Вы должны четко начать с описания данных временных рядов, с которыми вы работаете. В макроэкономике вы обычно работаете с агрегированными данными, а геометрические средства (что удивительно) имеют более эмпирические данные для данных временных рядов макросов, вероятно потому, что большинство из них разлагаются в экспоненциально растущую тенденцию .

Кстати, предложение Роба «визуально» работает для временных рядов с четкой сезонной частью , поскольку медленно меняющиеся годовые данные менее очевидны для увеличения вариаций. К счастью, обычно наблюдается экспоненциально растущая тенденция (если она кажется линейной, то нет необходимости в бревнах).

модель

Y(t)=X1α1(t)...Xkαk(t)ε(t)

В финансовой эконометрике журналы являются обычным делом из-за популярности журнальных возвратов, потому что ...

Преобразования журнала имеют хорошие свойства

αiY(T)Икся(T)

В моделях с исправлением ошибок у нас есть эмпирически более сильное предположение, что пропорции более стабильны ( стационарны ), чем абсолютные различия.

В экономической эконометрике легко агрегировать данные о доходах по времени .

Есть много других причин, не упомянутых здесь.

в заключение

Обратите внимание, что log-преобразование обычно применяется к неотрицательным (уровням) переменным. Если вы наблюдаете различия между двумя временными рядами (например, чистый экспорт), то невозможно даже взять журнал, вам придется либо искать исходные данные по уровням, либо принимать форму общей тенденции, которая была вычтена.

[ добавление после редактирования ] Если вам все еще нужен статистический критерий того, когда выполнять преобразование журнала, простым решением будет любой тест на гетероскедастичность. В случае увеличения дисперсии я бы порекомендовал тест Гольдфельда-Квандта или аналогичный ему. В R он находится в library(lmtest)и обозначается gqtest(y~1)функцией. Просто регресс в терминах перехвата, если у вас нет регрессионной модели, yэто ваша зависимая переменная.


Спасибо за информацию. С помощью теста GQ, чем ниже значение p, тем более вероятно, что распределение гетероскедастично?
Зак

@ Зак: точно, возьмите, например, 5%, если вы не планируете заниматься интеллектуальным анализом данных. Я лично начинаю с модельных предположений.
Дмитрий Челов

@Dmitrij. Спасибо. Я просто хочу убедиться, что я правильно интерпретирую вывод.
Зак

29

Постройте график данных в зависимости от времени. Если похоже, что вариация увеличивается с уровнем серии, возьмите журналы. В противном случае смоделируйте исходные данные.


3
Вот вопрос: каков эффект, если вы берете логи, а они не нужны? Мне понравилось это при работе с временными рядами, которые требуют преобразования журнала, потому что (насколько я понимаю) коэффициенты - это отношения, а при небольших значениях - почти проценты. (Например, exp (0,05) = 1,051.)
Уэйн

4

По плодам их узнаете

Предположение (подлежащее проверке) состоит в том, что ошибки модели имеют постоянную дисперсию. Обратите внимание, что это не означает ошибки предполагаемой модели. Когда вы используете простой графический анализ, вы по существу предполагаете линейную модель во времени.

Таким образом, если у вас есть неадекватная модель, такая, которая может быть предложена случайным графиком данных в зависимости от времени, вы можете ошибочно сделать вывод о необходимости силового преобразования. Бокс и Дженкинс сделали это с их примером данных авиакомпании. Они не учитывают 3 необычных значения в самых последних данных, таким образом, они неверно пришли к выводу, что на самом высоком уровне ряда были большие отклонения в остатках.

Для получения дополнительной информации по этому вопросу см. Http://www.autobox.com/pdfs/vegas_ibf_09a.pdf.


1

Возможно, вы захотите логарифмировать ряды, когда они имеют естественную геометрическую форму или когда временная стоимость инвестиций подразумевает, что вы будете сравнивать с облигацией с минимальным риском, которая имеет положительный доход. Это сделает их более «линеаризуемыми» и, следовательно, пригодными для простого разностного отношения повторения.


1
Преобразования подобны наркотикам: некоторые полезны для вас, а некоторые нет. Если вам не интересно проверять статистические гипотезы, вы можете предположить, что вам нравится. Параметрические проверки гипотезы имеют предположения о цене ошибки, игнорируйте их на свой страх и риск.
IrishStat

1
Это точно. Я сказал, что процесс должен быть геометрическим. Неспособность преобразовать может также привести к ошибкам в выводе. Я не понимаю, где я предлагал игнорировать предположения относительно условий действительного вывода.
DWin

1
stats.stackexchange.com/questions/6498/… включил обсуждение того, когда и зачем преобразовывать. «Тот факт», что исходный результат является «геометрическим», не означает, что остатки от адекватной модели имеют стандартное отклонение, пропорциональное среднему значению. Это может НО это должно быть эмпирически доказано или, по крайней мере, проверено.
IrishStat
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.