Может кто-нибудь объяснить функцию автокорреляции в данных временных рядов? Применяя acf к данным, каким будет приложение?
Может кто-нибудь объяснить функцию автокорреляции в данных временных рядов? Применяя acf к данным, каким будет приложение?
Ответы:
В отличие от обычных данных выборки, данные временных рядов упорядочены. Поэтому есть дополнительная информация о вашем образце, которой вы могли бы воспользоваться, если есть полезные временные шаблоны. Функция автокорреляции является одним из инструментов, используемых для поиска закономерностей в данных. В частности, функция автокорреляции сообщает вам о корреляции между точками, разделенными различными временными задержками. В качестве примера, вот некоторые возможные значения функции acf для ряда с дискретными периодами времени:
Обозначение ACF (n = количество периодов времени между точками) = корреляция между точками, разделенными n периодами времени. Я приведу примеры для первых нескольких значений n.
ACF (0) = 1 (все данные идеально коррелируют с самим собой), ACF (1) =. 9 (корреляция между точкой и следующей точкой составляет 0,9), ACF (2) =. 4 (корреляция между точкой и точка на два шага вперед - 0,4) ... и т. д.
Итак, ACF сообщает вам, насколько коррелированы точки друг с другом, исходя из того, сколько временных шагов они разделены. В этом суть автокорреляции, это то, насколько коррелируют прошлые точки данных с будущими точками данных для разных значений временного разделения. Как правило, вы ожидаете, что функция автокорреляции упадет до 0, когда точки станут более разделенными (т. Е. N станет большим в приведенных выше обозначениях), потому что обычно сложнее прогнозировать дальнейшее будущее на основе данного набора данных. Это не правило, но типично.
Теперь, ко второй части ... почему мы заботимся? АКФ и его родственная функция, частичнаяФункция автокорреляции (подробнее об этом чуть позже), используется в подходе моделирования Box-Jenkins / ARIMA для определения связи прошлых и будущих точек данных во временном ряду. Функция частичной автокорреляции (PACF) может рассматриваться как корреляция между двумя точками, которые разделены некоторым количеством периодов n, НО с эффектом устранения промежуточных корреляций. Это важно, потому что допустим, что в действительности каждая точка данных напрямую связана только с СЛЕДУЮЩЕЙ точкой данных, и ни с какой другой. Тем не менее, он будет появляться, как будто текущая точка коррелируется с точками в будущем, но только из-за эффекта типа «цепной реакции», т. Е. T1 напрямую коррелирует с T2, который напрямую коррелирует с T3, поэтому он выглядит как Т1 напрямую связан с Т3. PACF удалит промежуточную корреляцию с T2, чтобы вы могли лучше различать паттерны. Хорошее вступление к этомуВот.
В интерактивном справочнике по технической статистике NIST также есть глава, посвященная этому, и пример анализа временных рядов с использованием автокорреляции и частичной автокорреляции. Я не буду воспроизводить это здесь, но пройдусь по нему, и у вас должно быть гораздо лучшее понимание автокорреляции.
позвольте мне дать вам другую точку зрения.
построить отложенные значения временного ряда с текущими значениями временного ряда.
если график, который вы видите, является линейным, это означает, что существует линейная зависимость между текущими значениями временного ряда и запаздывающими значениями временного ряда.
Автокорреляционные значения являются наиболее очевидным способом измерения линейности этой зависимости.