Почему временные ряды должны быть стационарными?


92

Я понимаю, что стационарный временной ряд - это тот, чье среднее значение и дисперсия постоянны во времени. Может кто-нибудь объяснить, почему мы должны убедиться, что наш набор данных является стационарным, прежде чем мы сможем запустить на нем различные модели ARIMA или ARM? Относится ли это также к нормальным регрессионным моделям, где автокорреляция и / или время не имеют значения?


2
Какие модели ARM? Вы имели в виду ARMA?
mpiktas

9
Стационарность требует большего, чем постоянное среднее и дисперсия. Слабая стационарность требует, чтобы ковариационная функция не зависела от . tcov(Xt,Xt+h)t
mpiktas

11
Вам не требуется стационарность для запуска модели AR MA, поскольку, если порядок , он явно нестационарный. Однако стационарность является предположением ARMA. Я ( ) > 0II()>0
Glen_b

1
+1 для комментария к заказу, хотя строго, это только если заказ находится в . Для произвольных приказов есть ARFIMA{ 0 , 1 , 2 , . , , }I{0,1,2,...}
сопряженная собственность

@Glen_b Можно ли применять модели ARIMA для любых нестационарных серий? Или есть какие-то особые случаи не стационарности, в которых может применяться ARIMA?
Низар

Ответы:


75

Стационарность - это один тип структуры зависимости.

Предположим , у нас есть данные . Самое основное предположение состоит в том, что X i независимы, т.е. у нас есть выборка. Независимость - хорошее свойство, так как с ее помощью мы можем получить много полезных результатов. Проблема в том, что иногда (или часто, в зависимости от вида) это свойство не сохраняется.X1,...,XnXi

Теперь независимость является уникальным свойством, две случайные переменные могут быть независимыми только одним способом, но они могут зависеть по-разному. Таким образом, стационарность является одним из способов моделирования структуры зависимости. Оказывается, что много хороших результатов, которые справедливы для независимых случайных величин (закон больших чисел, центральная предельная теорема и многие другие), справедливы для стационарных случайных величин (мы должны строго сказать последовательности). И, конечно же, оказывается, что многие данные можно считать стационарными, поэтому концепция стационарности очень важна при моделировании независимых данных.

Когда мы определили, что у нас есть стационарность, естественно, мы хотим смоделировать ее. Именно здесь приходят модели ARMA. Оказывается, что любые стационарные данные могут быть аппроксимированы стационарной моделью ARMA благодаря теореме разложения Вольда . Вот почему модели ARMA очень популярны, и поэтому мы должны убедиться, что серия является стационарной для использования этих моделей.

Теперь опять та же история, что и с независимостью и зависимостью. Стационарность определяется однозначно, т. Е. Данные являются либо стационарными, либо нет, поэтому существует только один способ, чтобы данные были стационарными, но существует множество способов нестационарности данных. Снова оказывается, что много данных становится постоянным после определенного преобразования. Модель ARIMA - это одна модель нестационарности. Предполагается, что данные становятся постоянными после различий.

В контексте регрессии важна стационарность, поскольку те же результаты, которые применяются к независимым данным, сохраняются, если данные являются стационарными.


4
Я бы посоветовал вам добавить эту часть вашего ответа («Вот где приходят модели ARMA. Оказывается, что любые стационарные данные могут быть аппроксимированы стационарной моделью ARMA, благодаря теореме разложения Вольда. Именно поэтому модели ARMA очень популярный, и именно поэтому мы должны убедиться, что серия является стационарной, чтобы использовать эти модели. ") выделено жирным шрифтом, потому что именно это в первую очередь отвечает на вопрос.
поэт Модит

34

Какие величины нас обычно интересуют, когда мы выполняем статистический анализ временных рядов? Мы хотим знать

  • Его ожидаемое значение,
  • Его дисперсия и
  • ss

Как мы рассчитываем эти вещи? Использование среднего значения за многие периоды времени.

Среднее значение для многих периодов времени является информативным, только если ожидаемое значение является одинаковым для этих периодов времени. Если эти параметры популяции могут варьироваться, что мы на самом деле оцениваем, принимая среднее значение по времени?

(Слабая) стационарность требует, чтобы эти величины популяции были одинаковыми во времени, что делает выборочный средний показатель разумным способом их оценки.

В дополнение к этому, стационарные процессы позволяют избежать проблемы ложной регрессии .


12

Основная идея статистического обучения заключается в том, что вы можете учиться, повторяя эксперимент. Например, мы можем продолжать щелкать чертёжной кнопкой, чтобы узнать вероятность того, что чертёжная кнопка приземлится на его голову.

В контексте временных рядов мы наблюдаем один прогон случайного процесса, а не повторные прогоны случайного процесса. Мы наблюдаем 1 длинный эксперимент, а не несколько независимых экспериментов.

Нам нужны стационарность и эргодичность, чтобы наблюдение стохастического процесса в долгосрочной перспективе было аналогично наблюдению многих независимых течений стохастического процесса.

Некоторые (неточные) определения

Ω{Yt}t{1,2,3,}ωΩ

  • tYtΩ
  • ωX(ω){Y1(ω),Y2(ω),Y3(ω),}

Основная проблема во временных рядах

X1X2X3i=1,,nωiΩX1ni=1nXiE[X]

tΩ

1Tt=1TYt

Чтобы несколько наблюдений с течением времени выполняли аналогичную задачу, как многократные извлечения из выборочного пространства , нам нужны стационарность и эргодичность .

E[Y]1Tt=1TYtE[Y]

Пример 1: сбой стационарности

{Yt}Yt=t{Yt}

St=1ti=1tYiSttS1=1,S2=32,S3=2,,St=t+12YtStt

Пример: сбой эргодичности

XYt=Xt{Yt}=(0,0,0,0,0,0,0,){Yt}=(1,1,1,1,1,1,1,

E[Yt]=12St=1ti=1tYiYt


11

Чтобы добавить высокоуровневый ответ к некоторым другим ответам, которые являются хорошими, но более подробными, важна стационарность, поскольку при ее отсутствии модель, описывающая данные, будет различаться по точности в разные моменты времени. По существу, стационарность требуется для выборочных статистических данных, таких как средние значения, дисперсии и корреляции, для точного описания данных во всех интересующих моментах времени.

600<t<800200<t<400

введите описание изображения здесь


8

xt=xt1+et

Тем не менее, мы часто ищем стационарность. Почему?

Рассмотрим проблему прогнозирования. Как вы прогнозируете? Если завтра все будет иначе, то невозможно предсказать, потому что все будет иначе. Таким образом, ключ к прогнозированию - найти то, что будет таким же завтра, и перенести это на завтра. Это что-то может быть чем угодно. Я приведу пару примеров.

etN(0,σ2)σ2Δxtxtxt1=etΔxt

xt=αt+etE[et]=0α

Для прогнозирования нам абсолютно необходимо найти постоянную (временную) составляющую в ряду, иначе невозможно сделать прогноз по определению. Стационарность - это частный случай инвариантности.


5

Поскольку ARIMA по большей части регрессирует сама по себе, она использует тип самоиндуцированной множественной регрессии, на которую неоправданно влияет либо сильная тенденция, либо сезонность. Этот метод множественной регрессии основан на предыдущих значениях временных рядов, особенно в последних периодах, и позволяет нам извлечь очень интересную «взаимосвязь» между несколькими прошлыми значениями, которая работает для объяснения будущей ценности.


2

X(Xt+1,,Xt+k)(X1,,Xk)tk, Из Вики: стационарный процесс (или строгий (ли) стационарный процесс или сильный (ли) стационарный процесс) - это случайный процесс, совместное распределение вероятностей которого не изменяется при смещении во времени или пространстве. Следовательно, такие параметры, как среднее значение и дисперсия, если они существуют, также не изменяются со временем или положением. Кроме того, поскольку кардинал правильно указал ниже, автокорреляционная функция должна быть инвариантной во времени (что означает, что ковариационная функция постоянна во времени) преобразуется в параметры модели ARMA, являющиеся инвариантными / постоянными для всех временных интервалов.

Идея стационарности модели ARMA тесно связана с идеей обратимости.

y(t)=1.1y(t1)(11.1B)


1
X

Упоминание о стационарном устройстве второго порядка, похоже, было потеряно в вашем последнем издании. Это было намеренно? (Мой оригинальный комментарий был больше направлен на стационарность второго порядка, чем на строгую стационарность.)
Кардинал

: cardinal Я думаю, я чувствовал, что ваш комментарий важен и прояснил, что предполагается. Если вы думаете, что идея «второго порядка» добавляет ясности, пожалуйста, помогите мне добавить ее к моему ответу таким образом, чтобы пролить свет на простой и понятный английский.
IrishStat

-2

ARMA и ARIMA построены с предположением, что серия является стационарной. Если серии нет, то прогноз будет неверным.

Выборочная статистика - среднее значение, дисперсия, ко-дисперсия - полезна в качестве дескрипторов будущего поведения, только если ряд является стационарным. Например, если ряд последовательно увеличивается с течением времени, среднее значение выборки и дисперсия будут расти вместе с размером выборки, и они всегда будут недооценивать среднее значение и дисперсию в будущих периодах. Важно быть осторожным при попытке экстраполировать регрессионные модели, приспособленные к нестационарным данным.


-3

На мой взгляд, стохастический процесс - это процесс, который определяется тремя статистическими свойствами, которые должны быть неизменными во времени. Это средняя дисперсия и функция автокорреляции. Хотя первые два ничего не говорят об эволюции процесса во времени, поэтому следует учитывать третье свойство - автокорреляционную функцию, которая говорит о том, как зависимость затухает с течением времени (лаг).


5
Это сбивает с толку быть стохастическим процессом и быть стационарным, поэтому он начинается с фундаментальной ошибки. Что ваш ответ добавляет к уже опубликованным?
Ник Кокс

-3

Чтобы решить что-либо, нам нужно математически смоделировать уравнения с использованием статики.

  1. Для решения таких уравнений он должен быть независимым и стационарным (не движущимся)
  2. Только в стационарных данных мы можем получать информацию и выполнять математические операции (среднее значение, дисперсия и т. Д.) Для многоцелевых целей.
  3. В нестационарных трудно получить данные

В процессе конвертации мы получим тренд и сезонность


2
Ни один из ваших ответов не имеет смысла. Суть вопроса неверна. Многие временные ряды можно считать нестационарными как теоретически, так и наблюдательно. Есть много способов справиться с этим, например! дифференцирование или сезонное дифференцирование ряда или 2. включая циклические компоненты, такие как синусоидальные волны.
Майкл Черник

@MichaelChernick Во время дифференцирования и сезонного дифференцирования мы конвертируем нестационарные ряды в стационарные. Я согласен с вашей точкой зрения, что многие временные ряды нестационарны, но для математического решения нам нужно преобразовать их в стационарный справа
saravanan saminathan
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.