Похоже, не существует стандартного способа справиться с отсутствующими данными в контексте семейства моделей экспоненциального сглаживания. В частности, реализация R, называемая ets в пакете прогноза , кажется, просто берет самую длинную подпоследовательность без пропущенных данных, и книга «Прогнозирование с экспоненциальным сглаживанием» Hyndman et al. похоже не говорит о пропущенных данных вообще.
Я хотел бы сделать немного больше, если мои пользователи прямо просят меня об этом (и если недостающие данные не появляются слишком близко друг к другу или в слишком много периодов, которые находятся точно в одном сезоне). В частности, я имею в виду следующее. Во время симуляции всякий раз, когда я сталкиваюсь с отсутствующим значением , я текущий прогноз точки на , так что . Это, например, сделает точку данных не учитываемой для процесса оптимизации параметров.
Как только у меня будет подходящее соответствие для параметров, я могу оценить стандартное отклонение ошибок (предполагается, что оно нормальное со средним значением ) и убедиться, что использование значений для сгенерированных из этого распределения, не уменьшает вероятность в большой степени. Я бы использовал такие значения для прогнозирования (используя симуляцию).
Есть ли известные подводные камни с этим методом?