Предполагает ли корреляция стационарность данных?


27

Межрыночный анализ - это метод моделирования поведения рынка путем нахождения отношений между различными рынками. Часто рассчитывается корреляция между двумя рынками, например, S & P 500 и 30-летними казначейскими обязательствами США. Эти вычисления чаще всего основаны на ценовых данных, что очевидно для всех, что они не соответствуют определению стационарных временных рядов.

Помимо возможных решений (с использованием возвратов), является ли вычисление корреляции, данные которого нестационарны, даже достоверным статистическим вычислением?

Вы сказали бы, что такой расчет корреляции является несколько ненадежным, или просто бессмыслицей?


1
что вы подразумеваете под «достоверным статистическим расчетом», вы должны сказать «достоверный статистический (оценочный) расчет чего-либо» Здесь что-то очень важно. Корреляция - это действительный расчет линейной зависимости между двумя наборами данных. Я не понимаю, почему вам нужна стационарность, вы имели в виду автокорреляцию?
Робин Жирар

2
Существует новый сайт, который может быть более подходящим для вашего вопроса: quant.stackexchange.com . Теперь вы явно путаете расчет с интерпретацией.
mpiktas

@mpiktas, количественное сообщество основано на использовании доходов против цен из-за стационарности доходов и нестационарности цен. Я прошу здесь нечто большее, чем интуитивное объяснение того, почему это должно быть так.
Milktrader

@robin, есть несколько вещей, которые могут заставить вас подвергнуть сомнению статистический анализ. На ум приходит размер выборки, как и более очевидные вещи, такие как манипулируемые данными. Нестационарность данных ставит под сомнение расчет корреляции?
Milktrader

не расчет, может быть, интерпретация, если корреляция не высока. Если оно высокое, это означает высокую корреляцию (т. Е. Высокую линейную зависимость), два нестационарных временных ряда, например, и ( Y t ), могут быть потенциально сильно коррелированными (например, когда X t = Y t .(Xt)(Yt)Xt=Yt
Робин Жирар

Ответы:


37

Корреляция измеряет линейные отношения. В неформальном контексте отношения означают что-то стабильное. Когда мы вычисляем выборочную корреляцию для стационарных переменных и увеличиваем количество доступных точек данных, эта выборочная корреляция стремится к истинной корреляции.

Можно показать, что для цен, которые обычно являются случайными блужданиями, выборочная корреляция стремится к случайной переменной. Это означает, что независимо от того, сколько у нас данных, результат всегда будет разным.

Заметьте, я пытался выразить математическую интуицию без математики. С математической точки зрения объяснение очень ясное: выборочные моменты стационарных процессов сходятся по вероятности к постоянным. Выборочные моменты случайных блужданий сходятся к интегралам броуновского движения, которые являются случайными величинами. Поскольку связь обычно выражается в виде числа, а не случайной величины, причина не расчета корреляции для нестационарных переменных становится очевидной.

Обновление Поскольку нас интересует корреляция между двумя переменными, предположим сначала, что они происходят от стационарного процесса . Стационарность означает, что E Z t и c o v ( Z t , Z t - h ) не зависят от t . Итак, соотношениеZt=(Xt,Yt)EZtcov(Zt,Zth)t

corr(Xt,Yt)=cov(Xt,Yt)DXtDYt

tcov(Zt)t

ρ^=1Tt=1T(XtX¯)(YtY¯)1T2t=1T(XtX¯)2t=1T(YtY¯)2
ρ=corr(Xt,Yt)ρ^ρTT(ρ^ρ)N(0,σρ2)ρ

Ztcorr(Xt,Yt)tTTρtρt

Zt=(Xt,Yt)Zt=s=1t(Ut,Vt)Ct=(Ut,Vt)ECt=0

corr(XtYt)=EXtYtDXtDYt=Es=1tUts=1tVtDs=1tUtDs=1tVt

Ct=(Ut,Vt)E(CtCt+h)h>0corr(Ut,Vt)

corr(Xt,Yt)=tEUtVtt2DUtDVt=corr(U0,V0).

Пока все хорошо, хотя процесс не является стационарным, корреляция имеет смысл, хотя мы должны были сделать те же ограничительные предположения.

Теперь, чтобы увидеть, что происходит с выборочной корреляцией, нам нужно использовать следующий факт о случайных блужданиях, называемый функциональной центральной предельной теоремой:

1TZ[Ts]=1Tt=1[Ts]Ct(cov(C0))1/2Ws,
s[0,1]Ws=(W1s,W2s)Ms=(M1s,M2s)=(cov(C0))1/2Ws

Опять же для простоты определим выборочную корреляцию как

ρ^=1Tt=1TXtYt1Tt=1TXt21Tt=1TYt2

Давайте начнем с отклонений. У нас есть

E1Tt=1TXt2=1TEt=1T(s=1tUt)2=1Tt=1TtσU2=σUT+12.

T

1T2t=1TXt2=t=1T1T(1Ts=1tUt)201M1s2ds
T

Точно так же мы получаем

1T2t=1TYt201M2s2ds
1T2t=1TXtYt01M1sM2sds

Итак, наконец, для выборочной корреляции нашего случайного блуждания мы получаем

ρ^01M1sM2sds01M1s2ds01M2s2ds
T

Таким образом, хотя корреляция хорошо определена, выборочная корреляция не сходится к ней, как в случае стационарного процесса. Вместо этого он сходится к определенной случайной переменной.


1
Математическая точка зрения - это то, что я искал. Это дает мне возможность размышлять и исследовать дальше. Спасибо.
Milktrader

1
Этот ответ, кажется, обходит первоначальный вопрос: разве вы не говорите, что да, расчет корреляции имеет смысл для стационарных процессов?
whuber

1
@whuber, я отвечал на вопрос, имея в виду комментарий, но я перечитал вопрос еще раз и, насколько я понимаю, ОП спрашивает о расчете корреляции для нестационарных данных. Расчет корреляции для стационарных процессов имеет смысл, все макроэкономический анализ (VAR, VECM) опирается на это.
mpiktas

Я постараюсь уточнить мой вопрос с ответом.
whuber

3
@whuber Мой вывод от ответа состоит в том, что корреляция, основанная на нестационарных данных, дает случайную переменную, которая может или не может быть полезной. Корреляция на основе стационарных данных сходится к константе. Это может объяснить, почему трейдеров привлекает «скользящая корреляция x-day», потому что коррелированное поведение является мимолетным и ложным. Вопрос о том, является ли «корреляция x-day» действительным или полезным, - это другой вопрос.
Milktrader

13

... является ли вычисление корреляции, данные которого нестационарны, даже достоверным статистическим расчетом?

WhPVP(0)=1P(t+1)=P(t)V(t)>hP(t+1)=P(t)V(t)=P(t)W(t)VWVhW

введите описание изображения здесь

h=5WV

VWVW

Код Mathematica для создания фигуры:

With[{h=5},
pv[{p_, v_}, w_] := With[{q=If[v > h, -p, p]}, {q, q w}];
w = Accumulate[RandomInteger[{-1,1}, 25 h^2]];
{p,v} = FoldList[pv, {1,0}, w] // Transpose;
ListPlot[{w,v}, Joined->True]]

хорошо, что ваш ответ указывает на это, но я бы не сказал, что процесс коррелирован, я бы сказал, что они зависимы. Это главное. Расчет корреляции действителен, и здесь он скажет «нет корреляции», и мы все знаем, что это не означает «нет зависимости».
Робин Жирар

1
@robin Это хороший момент, но я построил этот пример специально, чтобы в течение потенциально длительных периодов времени эти два процесса идеально коррелировали. Проблема заключается не в зависимости от корреляции, а по своей сути связана с более тонким явлением: то, что отношения между процессами изменяются в случайные периоды. В двух словах, это именно то, что может произойти на реальных рынках (или, по крайней мере, мы должны беспокоиться о том, что это может произойти!).
whuber

@whubert yes, и это очень хороший пример, показывающий, что существуют процессы, которые имеют очень высокую корреляцию в течение потенциально длительных периодов времени и все же вообще не коррелируют (но сильно зависят) применительно к большему временному масштабу.
Робин Жирар

2
@robin girard, я думаю, что ключевым моментом здесь является то, что для нестационарных процессов теоретическая корреляция меняется со временем, когда для стационарных процессов теоретическая корреляция остается неизменной. Таким образом, при выборочной корреляции, которая в основном представляет собой одно число, невозможно уловить изменение истинных корреляций в случае нестационарных процессов.
mpiktas
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.