Я впечатлен forecast
пакетом R , а также, например, zoo
пакетом для нерегулярных временных рядов и интерполяции пропущенных значений.
Мое приложение находится в области прогнозирования трафика в колл-центре, поэтому данные о выходных (почти) всегда отсутствуют, что может быть легко обработано zoo
. Кроме того, некоторые дискретные точки могут отсутствовать, я просто использую R NA
для этого.
Дело в том, что все приятное волшебство пакета прогноза, например eta()
, и auto.arima()
т. Д., Похоже, ожидает простые ts
объекты, то есть равноправные временные ряды, не содержащие пропущенных данных. Я думаю, что приложения реального мира для равномерно распределенных временных рядов, безусловно, существуют, но, на мой взгляд, очень ограничены.
Проблема нескольких дискретных NA
значений может быть легко решена с помощью любой из предложенных функций интерполяции, zoo
а также с помощью forecast::interp
. После этого я запускаю прогноз.
Мои вопросы:
- Кто-нибудь предлагает лучшее решение?
(мой главный вопрос) По крайней мере, в моей прикладной области, прогнозирования трафика центра обработки вызовов (и, насколько я могу представить, большинство других проблемных областей), временные ряды не равны. По крайней мере, у нас есть схема "рабочих дней" или что-то в этом роде. Какой лучший способ справиться с этим и при этом использовать всю крутую магию пакета прогноза?
Должен ли я просто «сжать» временной ряд, чтобы заполнить выходные, сделать прогноз, а затем снова «раздувать» данные, чтобы заново вставить значения NA в выходные? (Это было бы позором, я думаю?)
Есть ли планы сделать пакет прогноза полностью совместимым с пакетами нерегулярных временных рядов, такими как zoo или его? Если да, то когда, а если нет, то почему нет?
Я довольно новичок в прогнозировании (и статистике в целом), поэтому я могу упустить из виду кое-что важное.
auto.arima
может обрабатывать пропущенные значения.