Как вы делаете самозагрузку с данными временных рядов?


33

Недавно я узнал об использовании методов начальной загрузки для расчета стандартных ошибок и доверительных интервалов для оценок. Я узнал, что если данные являются IID, вы можете обрабатывать данные выборки как совокупность и выполнять выборку с заменой, и это позволит вам получить несколько результатов моделирования статистики теста.

В случае временных рядов вы явно не можете сделать это, потому что автокорреляция, вероятно, существует. У меня есть временной ряд, и я хотел бы рассчитать среднее значение данных до и после фиксированной даты. Есть ли правильный способ сделать это, используя модифицированную версию начальной загрузки?


16
Ключевое слово для поиска: Block bootstrap.
кардинал

Ответы:


26

Как указывает @cardinal, вариации «блочной загрузки» - это естественный подход. Здесь, в зависимости от метода, вы выбираете отрезки временного ряда, либо перекрывающиеся, либо нет, и фиксированной длины или случайные, что может гарантировать стационарность в выборках ( Politis и Romano, 1991 ), а затем соединяете их вместе, чтобы создать пересчитанные временные ряды. на котором вы вычисляете свою статистику. Также можно попытаться построить модели временных зависимостей, приводящих к методам Маркова, авторегрессионным ситам и другим. Но блочная загрузка - это, пожалуй, самый простой из этих методов.

Gonçalves and Politis (2011) - очень короткий обзор со ссылками. Книжное лечение - Lahiri (2010) .


@statnub Если это связано с вашим предыдущим вопросом о еженедельном вмешательстве в продажи, обратите внимание, что вы загрузитесь, если не доверяете предположениям модели, которые вы там развертывали. Использование оправданной модели временных рядов в первую очередь должно в идеале минимизировать риск вещей, которые указали бы на этот вид начальной загрузки ...
сопряженный

6
Хороший ответ. Позвольте мне просто добавить, что вы можете использовать tsbootв bootпакете в R для этого.
MånsT

@ MånsT Отлично. Я не знал об этом пакете.
conjugateprior

5

Икс1,···,ИксNИкс1,Икс2,···,ИксN

Модульная повторная выборка легко адаптируется к временным рядам. Повторные выборки получают путем моделирования модели временных рядов. Например, если модель ARIMA (p, d, q), то повторные выборки модели ARIMA (p, q) с MLE (из разностного ряда) коэффициентов авторегрессии и скользящего среднего и дисперсией шума. Повторными выборками являются последовательности частичной суммы моделируемого процесса ARIMA (p, q).

Бесмодельная повторная выборка временных рядов осуществляется путем повторной выборки блоков, также называемой блочной начальной загрузкой, которая может быть реализована с использованием функции tsboot в загрузочном пакете R. Идея состоит в том, чтобы разбить ряд на примерно равные по длине блоки последовательных наблюдений, повторно сэмплировать блок с заменой, а затем вставить блоки вместе. Например, если временной ряд имеет длину 200, а один использует 10 блоков длиной 20, то блоками являются первые 20 наблюдений, следующие 20 и т. Д. Возможной повторной выборкой является четвертый блок (наблюдение от 61 до 80), затем последний блок (наблюдение от 181 до 200), затем второй блок (наблюдение от 21 до 40), затем снова четвертый блок и так далее, пока не будет 10 блоков в повторной выборке.


1
Существуют и другие формы методов начальной загрузки блоков, в том числе блок начальной загрузки с перекрытием блоков и круговая загрузка блоков, которые подробно описаны в книге Лахири (2003) «Методы повторной выборки для зависимых данных». Эти методы применимы к стационарным временным рядам.
Майкл Р. Черник,
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.