У меня довольно предсказуемые ежедневные временные ряды с еженедельной сезонностью. Я могу придумать прогнозы, которые кажутся довольно точными (подтвержденными перекрестной проверкой), когда нет выходных. Однако, когда есть праздники, у меня возникают следующие проблемы:
- В моем прогнозе я получаю ненулевые числа для праздников, хотя все исторические праздники равны 0. Это действительно не главная проблема. Вопрос в том ...
- Поскольку обработка, которая не происходит в праздничные дни, «перетекает» в дни, следующие за праздничными днями, простая фиктивная переменная не обрезает ее, поскольку эти выбросы кажутся краткосрочными инновационными. Если бы не было еженедельной сезонности, я, возможно, мог бы дать оценку для распределения необработанных данных о празднике в течение пяти или около того дней после праздника (как предложено в разделе Как создать переменные, отражающие опережающее и запаздывающее влияние праздников / календарные эффекты в анализе временных рядов? ). Однако распределение «переполнения» зависит от дня недели, в который наступает праздник, и от того, является ли праздник Рождеством или Днем благодарения, когда заказы размещаются по более низкой ставке, чем в остальное время года.
Вот несколько снимков из моей перекрестной проверки, которые показывают прогноз (синий) и фактический (красный) результат для праздников, которые появляются в разные дни недели:
Я также беспокоюсь о том, что влияние Рождества зависит от дня недели, когда оно выпадает, и у меня есть только шесть или более лет исторических данных.
Есть ли у кого-нибудь предложения о том, как бороться с этими типами инновационных выбросов в контексте прогнозирования? (К сожалению, я не могу поделиться какими-либо данными)