Проблема здесь заключается в том, чтобы получить уравнение, которое анализирует наблюдаемые данные по сигналу и шуму. Если ваши данные просты, то ваш регрессионный подход может сработать. Следует позаботиться о том, чтобы понять некоторые из предположений, которые они делают с Пророком. Вы должны лучше понять, что делает Пророк, поскольку он не просто подходит для простой модели, но пытается добавить некоторую структуру.
Например, некоторые размышления, которые я сделал после прочтения их хорошо написанного вступления, могут помочь вам в вашей оценке. Я заранее прошу прощения, если я неправильно понял их подход, и хотел бы быть исправлен, если так.
1) Их основной пример имеет две точки перелома в тренде, но они захватили только наиболее очевидную.
2) Они игнорируют любую и всю структуру ARIMA, отражающую пропущенные стохастические ряды или ценность использования исторических значений Y для руководства прогнозом.
3) Они игнорируют любую возможную динамику (опережающие и запаздывающие эффекты) предложенных пользователем стохастических и детерминированных рядов. Причинно-следственные эффекты пророка просто современны.
4) Не предпринимается попытка идентифицировать сдвиги ступеней / уровней в последовательных или сезонных импульсах, например, изменение ПОЛНЕЧНОГО ЭФФЕКТА на полпути во времени из-за какого-то неизвестного внешнего события. Prophet предполагает «простой линейный рост», а не проверку его путем изучения альтернативных возможностей. Возможный пример этого см. В разделе « Прогнозирование повторяющихся заказов для бизнеса онлайн-подписки с использованием Facebook Prophet и R».
5) Синусы и косинусы являются непрозрачным способом борьбы с сезонностью, в то время как сезонные эффекты, такие как день недели, день месяца, неделя месяца, месяц года гораздо более эффективный / информативный, когда имеешь дело с антропогенными (имея дело с людьми!) эффектами.
Предлагать частоты 365,25 для годовых моделей не имеет смысла, потому что мы не выполняем то же самое действие в тот же день, что и в прошлом году, в то время как ежемесячная активность гораздо более постоянна, но Пророк не предлагает 11 месячных показателей. вариант. Еженедельные частоты 52 имеют мало смысла, потому что у нас нет 52 недель в каждый год.
6) Не делается никаких попыток проверить процессы ошибок, являющиеся гауссовскими, поэтому можно провести значимые тесты значимости.
7) Не нужно беспокоиться о том, чтобы дисперсия ошибки модели была однородной, т.е. не изменялась детерминистически в определенные моменты времени, предлагая взвешенные наименьшие квадраты. Не беспокойтесь о том, чтобы найти оптимальное силовое преобразование для пропорционального отклонения ошибки от ожидаемого значения. Когда (и почему) следует вести журнал распределения (чисел)? ,
8) Пользователь должен предварительно указать все возможные эффекты опережения и задержки вокруг событий / праздников. Например, ежедневные продажи часто начинают увеличиваться в конце ноября, отражая долгосрочный эффект Рождества.
9) Не беспокойтесь о том, что возникающие ошибки не имеют структуры, предлагая способы улучшения модели посредством диагностической проверки достаточности.
10) По-видимому, нет необходимости улучшать модель путем удаления несущественной структуры.
11) Нет возможности получить семейство смоделированных прогнозов, в которых доверительные пределы необязательно могут быть симметричными путем начальной загрузки ошибок модели с учетом возможных аномалий.
12) Предоставление пользователю возможности делать предположения о тенденциях (количество точек останова и фактических точек останова) обеспечивает нежелательную / непригодную гибкость в условиях крупномасштабного анализа, который по своему названию предназначен для крупномасштабных приложений без помощи рук.