Есть ли золотой стандарт для моделирования нерегулярно расположенных временных рядов?

45

В области экономики (я думаю) у нас есть ARIMA и GARCH для регулярно разнесенных временных рядов и Пуассон, Хоукс для моделирования точечных процессов, так как насчет попыток моделирования нерегулярно (неравномерно) разнесенных временных рядов - есть (по крайней мере) какие-либо общие практики ?

(Если у вас есть знания в этой теме, вы также можете расширить соответствующую статью вики .)

Редакция (о пропущенных значениях и нерегулярных временных рядах):

Ответ на комментарий @Lucas Reis. Если промежутки между измерениями или переменными реализаций разнесены из-за (например) процесса Пуассона, для такого рода регуляризации не так много места, но существует простая процедура: t(i)это i-й индекс времени переменной x (i-й момент времени реализации x), затем определяем промежутки между временами измерений как g(i)=t(i)-t(i-1), затем мы дискретизируем, g(i)используя константу c, dg(i)=floor(g(i)/cи создаем новый временной ряд с числом пустых значений между старыми наблюдениями из исходного временного ряда iи i+1равным dg (i), но проблема в том, что это Процедура может легко получить временные ряды с количеством пропущенных данных, намного превышающим количество наблюдений, поэтому разумная оценка значений отсутствующих наблюдений может быть невозможной и слишком большойcудалить "временную структуру / временную зависимость и т. д." анализируемой проблемы (крайний случай задается тем, c>=max(floor(g(i)/c))что просто сворачивают нерегулярно разнесенные временные ряды в регулярно разнесенные

Edition2 (просто для удовольствия): изображение учитывает пропущенные значения в нерегулярно расположенных временных рядах или даже в случае точечного процесса.

— Qbik
источник

Просто чтобы уточнить, когда вы говорите «нерегулярно с интервалом», вы не имеете в виду «с регулярным интервалом, но с пропущенными значениями», верно?

— Уэйн

2

Нет :) t(i)- время x[t(i)],x[t(i+1)],x[t(i+2)]...и t(j+1)-t(j)не постоянно. Данные собираются в распределенном или асинхронном имении.

— Qbik

2

Смежный вопрос: существует ли модель коинтеграции для нерегулярно расположенных временных рядов?

— Энди Ш

2

Как насчет интерполяции и выполнения анализа с интерполированными значениями, расположенными на регулярной основе? Кто-нибудь знает, каковы будут последствия этого метода?

— Лукас Рейс

Как насчет сначала моделирования времен точек, а затем значений точек, зависящих от их времени? Я считаю, что «отмеченные точечные процессы» - это термин.

— PeterR

26

Если наблюдения случайного процесса расположены нерегулярно, наиболее естественным способом моделирования наблюдений является наблюдение с дискретным временем из непрерывного процесса времени.

$X_{1}, \ldots, X_n$ $t_1 < t_2 < \ldots < t_n$ $X_{i}$ $X_{i-1}, \ldots, X_1$ $X_{i-1}$ $-$ $X_{i-2}, \ldots, X_1$ $-$ $t_i$ $t_{i-1}$ $t_i - t_{i-1}$

$t_i - t_{i-1} = 1$ $P^1$ $P^{t_{i}-t_{i-1}}$ $P^t$

d X_{t} = a (X_{t}) d t + b (X_{t}) d B_{t} .

$dX_t = a(X_t) dt + b(X_t) dB_t.$ Стефано Якус. Может быть так, что для эквидистантных наблюдений описано много методов и результатов, но обычно это просто удобно для представления и не существенно для приложения. Одним из основных препятствий является то, что спецификация SDE редко допускает явную вероятность, когда у вас есть дискретные наблюдения, но есть хорошо разработанные альтернативы уравнения оценки.

d X_{t} = \int_{0}^{t} a (s) (X_{t} - X_{s}) d s + σ d B_{t}

$dX_t = \int_0^t a(s)(X_t-X_s) ds + \sigma dB_t$

(p)

$(p)$

Я думаю, что было бы справедливо сказать, что общепринятой практикой при наблюдениях в нерегулярные моменты времени является построение стохастической модели с непрерывным временем.

— NRH
источник

1

GARCH - это не случайный процесс волатильности. Объем в GARCH полностью определяется для этого периода наблюдениями в предыдущих периодах.

— Аксакал

12

Для нерегулярных временных рядов легко построить фильтр Калмана .

Существует документ , как передать ARIMA в пространстве состояний здесь

$^{(1)}$

$(1)$

— bdecaf
источник

Извините, у меня нет доступа к этой последней статье, не могли бы вы мне помочь?

— Кварц

2

Я добавил цитату, чтобы ее было легко найти - здесь также есть препринт: eprints.soton.ac.uk/147383

— bdecaf

Бумага о переносе ARIMA в пространство состояний, похоже, содержит неработающую ссылку.

— ofey73

9

Когда я искал способ измерить количество флуктуаций в данных с нерегулярной выборкой, я наткнулся на эти две работы по экспоненциальному сглаживанию нерегулярных данных от Cipra [ 1 , 2 ]. Они основаны далее на методах сглаживания Брауна, Уинтерса и Холта (см. Статью Википедии об экспоненциальном сглаживании ) и на другом методе Райта (см. Статью для ссылок). Эти методы не предполагают многого о базовом процессе, а также работают с данными, показывающими сезонные колебания.

Я не знаю, считается ли это «золотым стандартом». Для своих собственных целей я решил использовать двухстороннее (одиночное) экспоненциальное сглаживание по методу Брауна. У меня появилась идея двухстороннего сглаживания чтения резюме в студенческую газету (которую я сейчас не могу найти).

— Ivana
источник

7

Анализ нерегулярно выбранных временных рядов может быть сложным, так как не так много доступных инструментов. Иногда практикой является применение регулярных алгоритмов и надежда на лучшее. Это не обязательно лучший подход. В других случаях люди пытаются интерполировать данные в промежутках. Я даже видел случаи, когда пробелы заполнялись случайными числами, которые имеют такое же распределение, что и известные данные. Одним из алгоритмов, специально предназначенных для рядов с нерегулярной выборкой, является периодограмма Ломба-Скаргла, которая дает периодограмму (спектр мощности) для неравномерно выбранных временных рядов. Lomb-Scargle не требует никакого «кондиционирования промежутка».

— cwkulp
источник

3

Если вам нужна «локальная» модель во временной области (в отличие от оценки корреляционных функций или спектров мощности), скажем, для обнаружения и характеристики переходных импульсов, скачков и т. Д., То алгоритм Байесовского блока может быть полезен. Он обеспечивает оптимальное кусочно-постоянное представление временных рядов в любом режиме данных и с произвольной (неравномерно) разнесенной выборкой. Видеть

«Исследования по астрономическому анализу временных рядов. VI. Байесовские блочные представления», Scargle, Jeffrey D .; Норрис, Джей П .; Джексон, Брэд; Chiang, James, Astrophysical Journal, Volume 764, 167, 26 pp. (2013). http://arxiv.org/abs/1207.5578

— Джефф Скаргл
источник

2

RJMartin, "Нерегулярные дискретизированные сигналы: теории и методы анализа", кандидатская диссертация, UCL, 1998, доступна онлайн. Глава 4 посвящена авторегрессионным моделям и развивает предмет с точки зрения непрерывного времени, как отмечалось в других постах.

— Ричард Мартин
источник

1

Раздел 4.10 Дж. Дурбина, С.Дж.Купмана, Анализ временных рядов с помощью методов пространства состояний , 2-е издание, 2012 г., посвящен моделированию в случае отсутствия наблюдений.

— Ян Галковски
источник

1

В анализе пространственных данных данные в большинстве случаев выбираются нерегулярно в пространстве. Поэтому одной идеей будет посмотреть, что там делается, и реализовать оценку вариограммы, кригинг и т. Д. Для одномерной области «времени». Вариограммы могут быть интересны даже для регулярно разнесенных данных временного ряда, поскольку они имеют отличные свойства от функции автокорреляции, а также являются определенными и значимыми даже для нестационарных данных.

Вот одна статья (на испанском), а здесь другая.

— Къетил б Халворсен
источник