Еще один вопрос о временных рядах от меня.
У меня есть набор данных, в котором ежедневно регистрируются случаи насилия в психиатрической больнице в течение трех лет. С помощью моего предыдущего вопроса я возился с этим и теперь немного счастливее.
У меня сейчас есть то, что ежедневные сериалы очень шумные. Он сильно колеблется, вверх и вниз, от 0 до 20 раз. Используя графики лёсса и пакет прогноза (который я очень рекомендую новичкам, таким как я), я просто получаю абсолютно ровную линию с огромными доверительными интервалами от прогноза.
Однако агрегирование еженедельных или ежемесячных данных имеет гораздо больше смысла. Они сметаются с самого начала серии, а затем снова увеличиваются в середине. Составление графиков Лесс и прогнозный пакет создают нечто более значимое.
Хотя это немного похоже на обман. Я просто предпочитаю агрегированные версии, потому что они выглядят хорошо, без реальной валидации?
Или лучше вычислить скользящее среднее и использовать его в качестве основы? Боюсь, я недостаточно хорошо понимаю теорию, стоящую за всем этим, чтобы быть уверенным в том, что приемлемо