Что такое автокорреляционная функция?


16

Может кто-нибудь объяснить функцию автокорреляции в данных временных рядов? Применяя acf к данным, каким будет приложение?



В контексте стационарного временного ряда в широком смысле он дает меру зависимости временного ряда от его запаздывающей версии.
Кагдас Озгенц

1
это мера того, насколько на текущее значение влияют предыдущие значения во временном ряду.
htrahdis

@htrahdis Как и в стандартной установке регрессии, остерегайтесь соединяя корреляцию с воздействием (или причинно - следственной связи).
whuber

@Andy Эта ветка действительно выглядит аналогично - спасибо, что нашли ее - но принятый (и единственный) ответ не имеет прямого отношения к этому вопросу: он фокусируется на конкретном acf. Как таковой, он дает иллюстрацию того, как acf может быть интерпретирован, но мне неясно, отвечает ли какой-либо из этих материалов на настоящий запрос об объяснении ACF в целом.
whuber

Ответы:


31

В отличие от обычных данных выборки, данные временных рядов упорядочены. Поэтому есть дополнительная информация о вашем образце, которой вы могли бы воспользоваться, если есть полезные временные шаблоны. Функция автокорреляции является одним из инструментов, используемых для поиска закономерностей в данных. В частности, функция автокорреляции сообщает вам о корреляции между точками, разделенными различными временными задержками. В качестве примера, вот некоторые возможные значения функции acf для ряда с дискретными периодами времени:

Обозначение ACF (n = количество периодов времени между точками) = корреляция между точками, разделенными n периодами времени. Я приведу примеры для первых нескольких значений n.

ACF (0) = 1 (все данные идеально коррелируют с самим собой), ACF (1) =. 9 (корреляция между точкой и следующей точкой составляет 0,9), ACF (2) =. 4 (корреляция между точкой и точка на два шага вперед - 0,4) ... и т. д.

Итак, ACF сообщает вам, насколько коррелированы точки друг с другом, исходя из того, сколько временных шагов они разделены. В этом суть автокорреляции, это то, насколько коррелируют прошлые точки данных с будущими точками данных для разных значений временного разделения. Как правило, вы ожидаете, что функция автокорреляции упадет до 0, когда точки станут более разделенными (т. Е. N станет большим в приведенных выше обозначениях), потому что обычно сложнее прогнозировать дальнейшее будущее на основе данного набора данных. Это не правило, но типично.

Теперь, ко второй части ... почему мы заботимся? АКФ и его родственная функция, частичнаяФункция автокорреляции (подробнее об этом чуть позже), используется в подходе моделирования Box-Jenkins / ARIMA для определения связи прошлых и будущих точек данных во временном ряду. Функция частичной автокорреляции (PACF) может рассматриваться как корреляция между двумя точками, которые разделены некоторым количеством периодов n, НО с эффектом устранения промежуточных корреляций. Это важно, потому что допустим, что в действительности каждая точка данных напрямую связана только с СЛЕДУЮЩЕЙ точкой данных, и ни с какой другой. Тем не менее, он будет появляться, как будто текущая точка коррелируется с точками в будущем, но только из-за эффекта типа «цепной реакции», т. Е. T1 напрямую коррелирует с T2, который напрямую коррелирует с T3, поэтому он выглядит как Т1 напрямую связан с Т3. PACF удалит промежуточную корреляцию с T2, чтобы вы могли лучше различать паттерны. Хорошее вступление к этомуВот.

В интерактивном справочнике по технической статистике NIST также есть глава, посвященная этому, и пример анализа временных рядов с использованием автокорреляции и частичной автокорреляции. Я не буду воспроизводить это здесь, но пройдусь по нему, и у вас должно быть гораздо лучшее понимание автокорреляции.


2

позвольте мне дать вам другую точку зрения.

построить отложенные значения временного ряда с текущими значениями временного ряда.

если график, который вы видите, является линейным, это означает, что существует линейная зависимость между текущими значениями временного ряда и запаздывающими значениями временного ряда.

Автокорреляционные значения являются наиболее очевидным способом измерения линейности этой зависимости.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.