Что делать с пояснениями во временных рядах?


11

До сих пор работая в основном с данными поперечного сечения и совсем недавно просматривая, сканируя спотыкаясь через кучу вводной литературы по временным рядам, мне интересно, какую роль играют объясняющие переменные в анализе временных рядов.

Я хотел бы объяснить тенденцию, а не ослаблять тренд. Большая часть того, что я читаю в качестве введения, предполагает, что ряд вытекает из некоторого случайного процесса. Я читал о процессах AR (p) и MA, а также о моделировании ARIMA. Желая иметь дело с большим количеством информации, чем только с авторегрессионными процессами, я нашел VAR / VECM и привел несколько примеров, но все же мне интересно, есть ли какой-то случай, связанный с тем, что пояснения делают в сечениях.

Мотивация этого заключается в том, что декомпозиция моих серий показывает, что основной вклад вносит тренд, а остаток и сезонный эффект вряд ли играют роль. Я хотел бы объяснить эту тенденцию.

Могу ли я регрессировать сериал на несколько разных серий? Интуитивно я хотел бы использовать gls из-за последовательной корреляции (я не очень уверен насчет структуры cor). Я слышал о ложной регрессии и понимаю, что это ловушка, тем не менее, я ищу способ объяснить тенденцию.

Это совершенно неправильно или необычно? Или я только что пропустил нужную главу?

Ответы:


15

Основываясь на комментариях, которые вы предложили к ответам, вы должны знать о ложной причинности . Любая переменная с временной тенденцией будет коррелировать с другой переменной, которая также имеет временную тенденцию. Например, мой вес от рождения до 27 лет будет сильно коррелировать с весом от рождения до 27 лет Очевидно, что мой вес не вызван ваш вес. Если бы это было так, я бы попросил вас чаще ходить в спортзал, пожалуйста.

xtyt

xt=α0+α1t+ϵt andyt=β0+β1t+ηt.

yt=γ0+γ1xt+νt
xtγ1

Когда вы выполняете анализ временных рядов, вы должны быть уверены, что ваши переменные являются постоянными, иначе вы получите эти ложные результаты. Исключение составляют интегрированные серии, но я бы посоветовал вам ознакомиться с текстами временных рядов, чтобы узнать больше об этом.


5
+1 для примера ложной регрессии. Будет использовать его в лекциях :)
mpiktas

1
Э, вы идете в спортзал, чтобы похудеть? :)
hans0l0

6

Та же интуиция, что и в регрессии поперечного сечения, может быть использована в регрессии временных рядов. Совершенно верно попытаться объяснить тенденцию, используя другие переменные. Основное отличие состоит в том, что неявно предполагается, что регрессоры являются случайными величинами. Итак, в регрессионной модели:

Yt=β0+Xt1β1+...+Xtkβk+εt

E(εt|Xt1,...,Xtk)=0Eεt=0E(εt2|Xt1,...,Xtk)=σ2Eεt2=σ2

Практическая часть регрессии остается прежней, применяются все обычные статистические данные и методы.

Xtk

Основной оговоркой регрессии временного ряда является то, что он может массово потерпеть неудачу, когда регрессоры не являются стационарными. Тогда обычные методы регрессии могут показать, что тенденция объясняется, а на самом деле это не так. Поэтому, если вы хотите объяснить тенденцию, вы должны проверить нестационарность, прежде чем продолжить. В противном случае вы можете прийти к ложным выводам.


1
Спасибо тебе за твое терпение. Тем не менее, ВВП может быть возможным объяснением моей переменной. Вероятно, я лучше использую темпы роста, потому что в противном случае это просто временная тенденция. Причина, по которой я хочу использовать регрессию, заключается в том, что я заинтересован в извлечении того, что на самом деле НЕ объясняется переменными временного тренда, такими как ВВП.
hans0l0

1
@ ran2, всегда лучше использовать рост ВВП вместо его реальной стоимости. Обратите внимание, что регрессионный анализ также может сказать вам, какие переменные не объясняют тенденцию, поэтому вы можете получить результат, что нет переменных, которые могли бы объяснить вашу тенденцию (или переменные, о которых вы думали, не объясняют тенденцию).
mpiktas

1
@raegtin, стационарные процессы, которые не имеют, например, вторых моментов.
mpiktas

1
Единственное, что я хотел бы добавить, это быть осторожным с использованием мира «объяснить». Некоторым рецензентам это не понравится.
Джейс

1
@Jase, я использовал термин в некотором смысле, который задал ОП, то есть найти значимые статистические отношения.
mpiktas

3

Если у вас есть поддерживающая / причинно-следственная / помогающая / правая / экзогенная / предикторная серия, предпочтительным подходом является построение единого уравнения, передаточной функции с несколькими входами. Необходимо изучить возможные остатки модели как для неопределенных / пропущенных детерминированных входных данных, т. Е. Сделать «Обнаружение интервенций», а также для журнала Ruey Tsay 1988 г. по прогнозированию, и неопределенных стохастических входных данных через компонент ARIMA. Таким образом, вы можете явно включить не только предложенные пользователем причины (и любые необходимые лаги!), Но и два вида пропущенных структур (макеты и ARIMA).

Следует позаботиться о том, чтобы параметры окончательной модели не изменялись значительно с течением времени, в противном случае сегментация данных могла бы быть в порядке и чтобы не было доказано, что остатки из окончательной модели имеют гетерогенную дисперсию.

Тенденция в исходной серии может быть связана с тенденциями в серии предикторов или из-за динамики авторегрессии в интересующей серии, или, возможно, из-за пропущенного детерминированного ряда, проксифицированного константой устойчивого состояния, или даже одной или несколькими тенденциями местного времени.


0

Как менее техническая точка зрения, часто бывает не очень полезно просто объяснить тенденцию; то есть рассматривать время как предсказатель первостепенного интереса. Изменения ряда во времени часто подразумевают влияние других переменных, включая авторегрессионные и / или экзогенные процессы, которые более концептуально актуальны для исследования. Отсюда следует, что если эти переменные также меняются во времени, то фактически необходимо контролировать влияние времени, чтобы не попасть в искусственно значимые отношения, как показало @mpiktas.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.