Что показывает график автокорреляции (панды)?


12

Я новичок и пытаюсь понять, что показывает график автокорреляции.

Я прочитал несколько объяснений из разных источников, таких как эта страница или связанная страница Википедии среди других, которые я здесь не цитирую.

У меня есть этот очень простой код, где у меня есть даты в моем индексе в течение года, и значения просто увеличиваются от 0 до 365 для каждого индекса .. ( 1984-01-01:0, 1984-01-02:1 ... 1984-12-31:365)

import numpy as np
import pandas as pd
from pandas.plotting import autocorrelation_plot
import matplotlib.pyplot as plt

dr = pd.date_range(start='1984-01-01', end='1984-12-31')

df = pd.DataFrame(np.arange(len(dr)), index=dr, columns=["Values"])
autocorrelation_plot(df)
plt.show()

где будет напечатанный график

введите описание изображения здесь

Я могу понять и понять, почему график начинается 1.00с:

Автокорреляция с нулевым запаздыванием всегда равна 1, потому что это представляет автокорреляцию между каждым членом и самим собой. Значение и значение с нулевым запаздыванием всегда будут одинаковыми.

Это хорошо, но почему этот график с задержкой 50, например, имеет значение около 0,65? И почему он падает ниже 0? Если бы я не показал код, который у меня есть, можно ли сделать вывод, что этот график автокорреляции показывает временной ряд с возрастающими значениями? Если да, можете ли вы попытаться объяснить это новичку, как вы можете это сделать?

Ответы:


12

Глядя на оценку автоковариационной функции с задержкой может оказаться полезным (обратите внимание, что автокорреляционная функция - это просто уменьшенная версия автоковариационной функции).h

γ^(h)=1nt=1nh(xt+hx¯)(xtx¯)

Идея состоит в том, что для каждого отставания мы проходим ряд и проверяем, удаляет ли точка времени коварию положительно или отрицательно (т. Е. Когда превышает среднее значение ряда, также поднимается выше или ниже). ?).hhtt+h

Ваша серия является монотонно возрастающей серией и имеет среднее значение . Посмотрим, что будет, когда .183h=130

Во-первых, обратите внимание, что мы можем вычислить функцию автоковариации только до момента времени 234, поскольку, когда , .t=234t+h=365

Кроме того, обратите внимание, что от до мы имеем, что также ниже среднего (так как 53 + 130 = 183, что является средним для ряда).t=1t=53t+h

И затем, от до , оцененная корреляция будет отрицательной, поскольку они коваризуются отрицательно.t=54t=182

Наконец, от до , оцененная корреляция будет снова положительной, так как и оба будут выше среднего.т = 234 т т + чt=183t=234tt+h

Видите ли вы, как это приведет к усреднению корреляции из-за приблизительно равных вкладов в функцию автоковариации из положительно ковариационных точек и отрицательно ковариационных точек?

Вы можете заметить, что существует больше точек, которые имеют ковариацию, чем точек, которые являются ковариантными. Однако, интуитивно, точки положительно ковариации имеют большую величину (поскольку они находятся дальше от среднего значения), тогда как точки отрицательно ковариации вносят меньшую величину в функцию автоковариации, поскольку они возникают ближе к среднему значению. Таким образом, это приводит к автоковариантной функции приблизительно равной нулю.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.