Я знаю о регуляризации типа LASSO, гребня и эластичной сетки в моделях линейной регрессии.

Вопрос:

Можно ли применить этот (или аналогичный) вид штрафных оценок к моделированию ARIMA (с непустой частью MA)?

При построении моделей ARIMA кажется обычным рассмотреть предварительно выбранный максимальный порядок задержки ( , ), а затем выбрать оптимальный порядок и например минимизируя AIC или AICc. Но можно ли вместо этого использовать регуляризацию? $p_{max}$ $q_{max}$ $p \leqslant p_{max}$ $q \leqslant q_{max}$

Мои дальнейшие вопросы :

Можем ли мы включить все члены до ( , ), но оштрафовать размер коэффициентов (потенциально вплоть до нуля)? Будет ли это иметь смысл? $p_{max}$ $q_{max}$
Если это так, было ли это реализовано в R или другом программном обеспечении? Если нет, в чем проблема?

Несколько похожий пост можно найти здесь .

— Ричард Харди
источник

+1 за очень хороший вопрос. Поскольку P, Q являются дискретными значениями, может быть более эффективно выполнить поиск в сетке, чтобы найти оптимальный порядок P, Q?

— синоптик

Я рад, что тебе понравилось! Да, поиск по сетке - это один из вариантов в структуре, который я называю «обычным». Там можно искать по сетке возможных комбинаций от до . Тем не менее, это все еще является частью "обычной структуры". В качестве альтернативы, я заинтересован в том, чтобы сохранить все лаги, но оштрафовать размер коэффициентов.

(p, q)

$(p,q)$

(0, 0)

$(0,0)$

(p_{m a x}, q_{m a x})

$(p_{max},q_{max})$

— Ричард Харди

columbia.edu/~sn2294/papers/forecast.pdf Предположительно, LASSO работает лучше, так как вы можете пропустить некоторые лаги вместо того, чтобы выставлять максимум. То же самое может быть сделано AIC, но тогда это становится вычислительно дорогим.

— Кагдас Озгенц

@CagdasOzgenc, я пролистал статью, но, похоже, она не имеет отношения к регуляризации, применяемой к моделям ARIMA (хотя она упоминает модели ARMA в контексте информационных критериев). Не могли бы вы указать, какая часть статьи относится к моим вопросам?

— Ричард Харди

5.3 таблица содержит модели ARMAX. Результаты относятся к моделям ARMA.

— Кагдас Озгенц

Отвечая на вопрос 1.

Chen & Chan "Выбор подмножества ARMA с помощью адаптивного лассо" (2011) * использует обходной путь, чтобы избежать требующей вычисления максимальной оценки вероятности. Ссылаясь на бумагу, они

Предложите найти оптимальную модель ARMA для подмножества путем подгонки адаптивной регрессии Лассо временных рядов к своим собственным лагам и остаткам, полученным при подгонке длинной авторегрессии к s. <...> [Под] условиями умеренной регулярности, предлагаемый метод достигает свойств оракула, а именно, он идентифицирует правильную модель ARMA подмножества с вероятностью, стремящейся к единице, когда размер выборки увеличивается до бесконечности, и <...> Оценки ненулевых коэффициентов асимптотически нормальны, а предельное распределение такое же, как и при нулевых коэффициентах, которые известны априори. $y_t$ $y_t$

При желании они предлагают оценку максимального правдоподобия и диагностику модели для выбранных подмножеств ARMA-моделей.

Wilms et al. «Разреженная идентификация и оценка многомерных векторных авторегрессионных скользящих средних» (2017) делают даже больше, чем я просил. Вместо одномерной модели ARIMA они используют вектор ARMA (VARMA) в больших измерениях и используют штраф для оценки и выбора порядка запаздывания. Они представляют алгоритм оценки и развивают некоторые асимптотические результаты. $L_1$

В частности, они используют двухэтапную процедуру. Рассмотрим модель VARMA которую необходимо оценить, но порядки запаздывания и неизвестны.

Y_{T} знак равно Σ_{L знак равно 1}^{п} Φ_{L} Y_{T - L} + Σ_{м знак равно 1}^{Q} Θ_{м} ε_{T - м} + ε_{T}

$y_t = \sum_{l=1}^p \Phi_l y_{t-l} + \sum_{m=1}^q \Theta_m \varepsilon_{t-m} + \varepsilon_t$

p

$p$

q

$q$

На этапе 1 они аппроксимируют модель VARMA с помощью модели VAR высокого порядка и оценивают ее, используя иерархический оценщик VAR, который накладывает основанное на лагах иерархическое наказание за лассо группы на параметры авторегрессии.
(Порядок задержки устанавливается равным . Уравнения модели оцениваются совместно и норма ошибок Фробениуса сведенминимуму с иерархическим групповой Lasso штрафом на коэффициентах регрессии). Они получают невязки , которые будут использоватьсякачестве прокси для истинных ошибок в стадии 2. $\lfloor 1.5\sqrt{T} \rfloor$ $||y-\hat y||_2^F$
$\hat\varepsilon := y - \hat y$
На этапе 2, они оценивают модель VARX , где Х представляет собой лаг остатков со стадии 1. То есть, они Minic модель VARMA , но использование оценками остатков вместо истинных ошибок, что позволяет применятьтот же оценщик (иерархической группы-лассо) снова так жекак в стадии 1 ( и
$Y_{T} знак равно Σ_{L знак равно 1}^{\hat{п}} Φ_{L} Y_{T - L} + Σ_{м знак равно 1}^{\hat{Q}} Θ_{м} {\hat{ε}}_{T - м} + U_{T},$ $y_t = \sum_{l=1}^{\hat p} \Phi_l y_{t-l} + \sum_{m=1}^{\hat q} \Theta_m \hat\varepsilon_{t-m} + u_t,$
$\hat p$ $\hat q$ установлены на .) $\lfloor 1.5\sqrt{T} \rfloor$

Подход Wilms et al. будет реализован в R пакет «Bigtime» .

Ссылки

Chen, K. & Chan, KS (2011). Подмножество выбора ARMA с помощью адаптивного лассо. Статистика и ее интерфейс , 4 (2), 197-205.
Wilms, I., Basu, S., Bien, J. & Matteson, DS (2017). Разреженная идентификация и оценка многомерных векторных авторегрессионных скользящих средних. Препринт arXiv arXiv: 1707.09208.

^{* Спасибо @hejseb за ссылку.}

— Ричард Харди
источник

Этот рабочий документ очень свежий, опубликованный на arXiv только вчера.

— Ричард Харди

Есть ли реализация в Python или R?

— Дэвид Масип

@DavidMasip, см. Обновленный пост для реализации R.

— Ричард Харди

Регуляризация для моделей ARIMA

Отвечая на вопрос 1.