Почему справедливо отклонять временные ряды от регрессии?

Это вообще может быть странный вопрос, но как новичок в предмете, я задаюсь вопросом, почему мы используем регрессию для определения временного ряда, если одним из предположений регрессии является то, что данные должны быть указаны, в то время как данные, к которым применяется регрессия, являются не iid?

— FarrukhJ
источник

Как правило, неверно, что мы предполагаем, что «данные» не найдены

— Кристоф Ханк,

Что вы подразумеваете именно под трендом ?

— Мэтью Ганн

У меня нет времени, чтобы написать правильный ответ / документ, подтверждающий это, но в целом последовательная корреляция не смещает результаты линейной регрессии (она изменяет правильное вычисление стандартных ошибок, доверительных интервалов и т. Д.). Это делает разумным классический двухэтапный подход (детренд, затем анализ на корреляцию). (например, некоторое прибегание к «беспристрастной линейной регрессии последовательной корреляции» приводит к fmwww.bc.edu/ec-c/f2010/228/EC228.f2010.nn12.pdf )

— Бену Болкеру

Возможно , еще важнее то , что МНК - оценка коэффициента по линейному тренду сходится целый порядок быстрее (при скорости

) к его истинному значению , чем для стационарных регрессоров (

), что означает Можно последовательно оценить тренд, даже если вы пренебрегаете стационарными переменными. Это противоречит оценке эффектов стационарных переменных одна за другой, когда вы теряете согласованность, если пропускаете переменные.

n^{- 3 / 2}

$n^{-3/2}$

n^{- 1 / 2}

$n^{-1/2}$

— Ричард Харди

Ответы:

Вы проницательны в ощущении, что может быть конфликт между классическими предположениями об обычной линейной регрессии наименьших квадратов и последовательной зависимостью, обычно встречающейся в настройке временных рядов.

Рассмотрим предположение 1.2 (Строгая экзогенность) эконометрики Фумио Хаяси .

E [ϵ_{i} ∣ X] = 0

$\mathrm{E}[\epsilon_i \mid X] = 0$

Это , в свою очередь , влечет , что любой остаточный ортогонален к любому регрессор . Как указывает Хаяси, это предположение нарушается в самой простой модели авторегрессии . [1] Рассмотрим процесс AR (1): $\mathrm{E}[\epsilon_i \mathbf{x}_j] = \mathbf{0}$ $\epsilon_i$ $\mathbf{x}_j$

y_{t} = β y_{t - 1} + ϵ_{t}

$y_{t} = \beta y_{t-1} + \epsilon_t$

$y_t$ $y_{t+1}$ $\epsilon_t$ $y_t$ $\mathrm{E}[\epsilon_ty_t]\neq0$

Поскольку строгое предположение о экзогенности нарушается, ни один из аргументов, основанных на этом допущении, не может быть применен к этой простой модели AR (1)!

Итак, у нас есть неразрешимая проблема?

Нет! Оценка AR (1) моделей с обычными наименьшими квадратами вполне допустима, стандартное поведение. Почему все еще может быть хорошо?

Большая выборка, асимптотические аргументы не нуждаются в строгой экзогенности. Достаточное допущение (которое можно использовать вместо строгой экзогенности) состоит в том, что регрессоры предопределены , что регрессоры ортогональны по отношению к условию одновременной ошибки. См. Хаяси Глава 2 для полного аргумента.

Ссылки

[1] Фумио Хаяси, Эконометрика (2000), с. 35

[2] Там же, с. 134

— Мэтью Ганн
источник

Основные методы регрессии типа наименьших квадратов не предполагают, что значения y являются iid. Они предполагают, что остатки (то есть значение y минус истинный тренд) являются iid.

Существуют и другие методы регрессии, которые делают разные предположения, но это, вероятно, усложнит этот ответ.

— Джеффри Брент
источник

Предположение, которое также явно ложно: просто подумайте о временном ряду с линейным трендом и сезонностью. Остальные остатки от линейной регрессии четко коррелируют, поэтому не идентифицированы.

— DeltaIV

Это хороший вопрос! Эта проблема даже не упоминается в моих книгах временных рядов (вероятно, мне нужны более качественные книги). Прежде всего, обратите внимание, что вы не обязаны использовать линейную регрессию для детерминации временных рядов, если ряд имеет стохастический тренд (единичный корень). )- Вы могли бы просто взять первую разницу. Но вы должны использовать линейную регрессию, если ряд имеет детерминированный тренд. В этом случае верно, что остатки не являются iid, как вы говорите. Подумайте только о серии, в которой есть линейный тренд, сезонные компоненты, циклические компоненты и т. Д. - все вместе - после линейной регрессии остатки практически независимы. Дело в том, что вы не используете линейную регрессию для прогнозирования или формирования интервалов прогнозирования. Это всего лишь часть вашей процедуры вывода: вам все еще нужно применять другие методы для получения некоррелированных остатков. Итак, пока линейная регрессия как таковая не является действительной процедурой вывода (это не правильная статистическая модель) для большинства временных рядов, процедура, которая включает линейную регрессию, поскольку один из ее шагов может быть допустимой моделью, если предполагаемая модель соответствует процессу генерирования данных для временная последовательность.

— DeltaIV
источник

Не дифференцируйте, если у вас есть детерминированный тренд - дифференциация подходит только для стохастических трендов (единичных корней). Если вы дифференцируете ряды без единичного корня, вы введете в модель ошибки интегрированного скользящего среднего, и это неприятно.

— Ричард Харди

Я думаю, что вы имеете в виду разницу, а не дифференцировать.

— Hong Ooi

y_{t} = β_{0} + β_{1} y_{t - 1} + ϵ_{t}

$y_t=\beta_0+\beta_1 y_{t-1}+\epsilon_t$

@HongOoi, да, мой плохой, я имел в виду разницу, а не дифференциацию. DeltaIV, временной ряд, как говорят, имеет стохастическую тенденцию, если временной ряд представляет собой интегрированный (= единичный корень) процесс. Это стандартный термин в литературе о единичных корнях и коинтеграции. Интересно, имеет ли он другое значение в других направлениях литературы? В любом случае, чрезмерное различие (= различие временного ряда, у которого нет единичного корня) является печально известным явлением, и его следует избегать.

— Ричард Харди

y = β_{0} + b e t a_{1} x_{1}

$y=\beta_0+beta_1 x_1$