Прогнозирование временных рядов с использованием ARIMA против LSTM


9

Проблема, с которой я имею дело, заключается в прогнозировании значений временных рядов. Я смотрю на один временной ряд за раз и на основе, например, 15% входных данных, я хотел бы предсказать его будущие значения. До сих пор я сталкивался с двумя моделями:

  • LSTM (долговременная кратковременная память; класс рекуррентных нейронных сетей)
  • ARIMA

Я попробовал оба и прочитал некоторые статьи на них. Теперь я пытаюсь понять, как их сравнивать. Что я нашел до сих пор:

  1. LSTM работает лучше, если мы имеем дело с огромным количеством данных и имеется достаточно данных для обучения, тогда как ARIMA лучше для небольших наборов данных (это правильно?)
  2. ARIMA требует ряд параметров, (p,q,d)которые должны быть рассчитаны на основе данных, в то время как LSTM не требует установки таких параметров. Однако есть некоторые гиперпараметры, которые нам нужно настроить для LSTM.

Кроме вышеупомянутых свойств, я не мог найти никаких других моментов или фактов, которые могли бы помочь мне выбрать лучшую модель. Я был бы очень признателен, если бы кто-нибудь мог помочь мне найти статьи, статьи или другие материалы (пока что не повезло, только некоторые общие мнения здесь и там, и ничего, основанное на экспериментах).

Я должен отметить, что изначально я имею дело с потоковыми данными, однако сейчас я использую наборы данных NAB, которые включают в себя 50 наборов данных с максимальным размером 20 тыс. Точек данных.


1
Почему бы вам просто не попробовать две модели на части ваших данных, посмотреть, какая из них лучше подходит для прогнозирования, и выбрать ее. Или используйте обе модели и объедините их прогнозы. Комбинации прогнозов часто превосходят индивидуальные прогнозы.
Ричард Харди

@RichardHardy Я уже сделал это и знаю, как они работают с моими наборами данных. Я пытаюсь лучше понять оба, особенно их недостатки, чтобы увидеть, какой из них может быть лучшим кандидатом для обработки предстоящих образцов данных.
Ахаджиб


Пожалуйста, прочитайте справочный центр - в частности, в третьем последнем абзаце, который гласит: « Пожалуйста, обратите внимание, однако, что перекрестная публикация не рекомендуется на сайтах SE. Выберите одно из лучших мест для размещения вашего вопроса. Позже, если окажется, что оно лучше подходит для другой сайт, его можно перенести. "
Glen_b

Ответы:


2

Сравнение моделей искусственных нейронных сетей и временных рядов для прогнозирования цен на сырьевые товары сравнивает эффективность ANN и ARIMA в прогнозировании финансовых временных рядов. Я думаю, что это хорошая отправная точка для вашего обзора литературы.

Во многих случаях нейронные сети имеют тенденцию превосходить модели на основе AR. Тем не менее, я думаю, что одним из основных недостатков (который не обсуждается в академической литературе) с более продвинутыми методами машинного обучения является то, что они используют черные ящики. Это большая проблема, если вам пришлось объяснять, как работает эта модель, тому, кто не знает так много этих моделей (например, в корпорации). Но если вы делаете этот анализ как школьную работу, я не думаю, что это будет проблемой.

Но, как сказал предыдущий комментатор, обычно лучшим способом является формирование оценки ансамбля, в которой вы объединяете две или более моделей.


7
Ссылка, которую вы цитировали, касается простых нейронных сетей с прямой связью, и она слишком старая, чтобы быть полезной (1990-е годы - сто лет назад). Вопрос OP спрашивает о рекуррентной нейронной сети с архитектурой LSTM, и этот документ не покрывает это.
horaceT

1
Как упомянул @horaceT, этот документ немного устарел, и если бы вы могли предложить более свежий документ, содержащий информацию о LSTM, было бы здорово. Спасибо
Ахаджиб,
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.