Определение времени автокорреляции (для эффективного размера выборки)


23

В литературе я нашел два определения времени автокорреляции слабо стационарного временного ряда:

τa=1+2k=1ρkversusτb=1+2k=1|ρk|

где - автокорреляция при лагеk. ρk=Cov[Xt,Xt+h]Var[Xt]k

Одно из применений времени автокорреляции - найти «эффективный размер выборки»: если у вас есть наблюдений временного ряда, и вы знаете его время автокорреляции τ , то вы можете притворяться, что у вас естьnτ

neff=nτ

независимые выборки вместо коррелированных для нахождения среднего значения. Оценка τ по данным является нетривиальной, но есть несколько способов сделать это (см. Томпсон 2010 ).nτ

Определение без абсолютных значений представляется более распространенным в литературе; но это допускает возможность τ a < 1 . Используя R и пакет "coda":τaτa<1

require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000)         # white noise 
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000)    # AR(1)
effectiveSize(ts.uncorr)                             # Sanity check
    # result should be close to 10000
effectiveSize(ts.corr)
    # result is in the neighborhood of 30000... ???

Функция «ffectiveSize »в« коде »использует определение времени автокорреляции, эквивалентного , выше. Существуют и другие пакеты R, которые вычисляют эффективный размер выборки или время автокорреляции, и все те, которые я пробовал, дают результаты, согласующиеся с этим: процесс AR (1) с отрицательным коэффициентом AR имеетболееэффективные выборки, чем коррелированные временная последовательность. Это кажется странным. τa

Очевидно, что это не может произойти в определения времени автокорреляции.τb

Как правильно определить время автокорреляции? Что-то не так с моим пониманием эффективных размеров выборки? результатпоказанный вышекажетсячто это должно быть неправильно ... что происходит?neff>n


Просто чтобы убедиться, что я не понял неправильно, разве это не должно быть вместо h ? Cov(Xt,Xt+k)h
sachinruk

2
Меня интересует второе определение, т. . Не могли бы вы предоставить литературу, где вы ее нашли? τb
Гарри

Ответы:


17

Во-первых, соответствующее определение «эффективного размера выборки» связано с ИМО с довольно конкретным вопросом. Если одинаково распределены со средним ц и дисперсией 1 эмпирическое среднее μ =X1,X2,μ - несмещенная оценкаµ. Но как насчет его дисперсии? Длянезависимыхпеременных дисперсия

μ^=1nk=1nXk
μ . Для слабо стационарных временных рядов, дисперсия ц является 1n1μ^ Аппроксимация справедлива для достаточно большихn. Если мы определимneff=n/τa, дисперсия эмпирического среднего значения для слабо стационарного временного ряда будет приблизительноn - 1 eff , что является такой же дисперсией, как если бы у нас былоneffнезависимых выборок. Таким образом,neff=n/τaявляется подходящим определением, если мы запрашиваем дисперсию эмпирического среднего. Это может быть неуместно для других целей.
1n2k,l=1ncov(Xk,Xl)=1n(1+2(n1nρ1+n2nρ2++1nρn1))τan.
nneff=n/τaneff1neffneff=n/τa

n1neff>n


2
Для тех, кто хочет узнать больше об использовании отрицательной корреляции в моделировании по методу Монте-Карло, попробуйте поискать «противоположные варианты». Больше информации в заметках курса здесь или здесь .
andrewtinka

1

см. http://arxiv.org/pdf/1403.5536v1.pdf

а также

https://cran.r-project.org/web/packages/mcmcse/mcmcse.pdf

для эффективного размера выборки. Я думаю, что альтернативная формулировка, использующая соотношение дисперсии выборки и асимптотической дисперсии цепи Маркова через среднее значение партии, является более подходящей оценкой.


4
Не могли бы вы расширить содержание этих ссылок? На самом деле это слишком мало для ответа по нашим стандартам!
kjetil b halvorsen
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.