автокорреляции
Соотношение между двумя переменными определяется как:y1,y2
ρ=E[(y1−μ1)(y2−μ2)]σ1σ2=Cov(y1,y2)σ1σ2,
где E - оператор ожидания, и - средние значения для а и - их стандартные отклонения.μ1μ2y1y2σ1,σ2
В контексте одной переменной, то есть автокорреляции , - исходный ряд, а - его запаздывающая версия. После приведенного выше определения выборочные автокорреляции порядка могут быть получены путем вычисления следующего выражения с наблюдаемым рядом , :y1y2k=0,1,2,...ytt=1,2,...,n
ρ ( k ) = 1н - кΣNt=k+1(yt−y¯)(yt−k−y¯)1n∑nt=1(yt−y¯)2−−−−−−−−−−−−−√1n−k∑nt=k+1(yt−k−y¯)2−−−−−−−−−−−−−−−−−−√,
где - среднее значение выборки данных.y¯
Частичные автокорреляции
Частичные автокорреляции измеряют линейную зависимость одной переменной после устранения влияния других переменных, которые влияют на обе переменные. Например, частичная автокорреляция порядка измеряет влияние (линейная зависимость) на после устранения влияния на и .Yт - 2YTYт - 1YTYт - 2
Каждая частичная автокорреляция может быть получена в виде серии регрессий вида:
Y~T= ϕ21Y~т - 1+ ϕ22Y~т - 2+ еT,
где - исходная серия минус среднее значение выборки, . Оценка даст значение частичной автокорреляции порядка 2. При расширении регрессии на дополнительных лагов оценка последнего члена даст частичную автокорреляцию порядка .Y~TYT- у¯φ22КК
Альтернативный способ вычисления частичных автокорреляций образца заключается в решении следующей системы для каждого порядка :К
⎛⎝⎜⎜⎜⎜ρ ( 0 )ρ ( 1 )⋮ρ ( k - 1 )ρ ( 1 )ρ ( 0 )⋮ρ ( k - 2 )⋯⋯⋮⋯ρ ( k - 1 )ρ ( k - 2 )⋮ρ ( 0 )⎞⎠⎟⎟⎟⎟⎛⎝⎜⎜⎜⎜φк 1φк 2⋮φк к⎞⎠⎟⎟⎟⎟= ⎛⎝⎜⎜⎜⎜ρ ( 1 )ρ ( 2 )⋮ρ ( к )⎞⎠⎟⎟⎟⎟,
где - пример автокорреляции. Это отображение между автокорреляциями образца и частичными автокорреляциями известно как
рекурсия Дурбина-Левинсона . Этот подход относительно легко реализовать для иллюстрации. Например, в программном обеспечении R мы можем получить частичную автокорреляцию порядка 5 следующим образом:ρ ( ⋅ )
# sample data
x <- diff(AirPassengers)
# autocorrelations
sacf <- acf(x, lag.max = 10, plot = FALSE)$acf[,,1]
# solve the system of equations
res1 <- solve(toeplitz(sacf[1:5]), sacf[2:6])
res1
# [1] 0.29992688 -0.18784728 -0.08468517 -0.22463189 0.01008379
# benchmark result
res2 <- pacf(x, lag.max = 5, plot = FALSE)$acf[,,1]
res2
# [1] 0.30285526 -0.21344644 -0.16044680 -0.22163003 0.01008379
all.equal(res1[5], res2[5])
# [1] TRUE
Полосы доверия
Полосы достоверности могут быть вычислены как значение автокорреляции образца , где - квантиль в распределении Гаусса, например, 1,96 для 95% доверительных интервалов.± z1 - α / 2N√Z1 - α / 21 - α / 2
Иногда используются доверительные интервалы, которые увеличиваются с увеличением порядка. В этом случае полосы могут быть определены как .± z1 - α / 21N( 1 + 2 ∑Кя = 1ρ ( я )2)----------------√