У меня есть непрерывная переменная, отобранная в течение года с нерегулярными интервалами. Некоторые дни имеют более одного наблюдения в час, в то время как другие периоды не имеют ничего в течение нескольких дней. Это делает особенно сложным обнаружение закономерностей во временных рядах, поскольку некоторые месяцы (например, октябрь) имеют высокую выборку, а другие - нет.
Мой вопрос: каков наилучший подход к моделированию этого временного ряда?
- Я считаю, что большинство методов анализа временных рядов (например, ARMA) нуждаются в фиксированной частоте. Я мог бы агрегировать данные, чтобы иметь постоянную выборку или выбрать подмножество данных, которые очень подробны. С обоими вариантами я бы упустил некоторую информацию из исходного набора данных, которая могла бы представить различные шаблоны.
- Вместо того, чтобы разбивать ряды на циклы, я мог бы снабдить модель всем набором данных и ожидать, что он подберет шаблоны. Например, я преобразовал час, день недели и месяц в категориальных переменных и попробовал множественной регрессии с хорошими результатами (R2 = 0,71)
У меня есть идея, что методы машинного обучения, такие как ANN, могут также выбирать эти шаблоны из неравномерных временных рядов, но мне было интересно, попробовал ли кто-нибудь это, и мог бы дать мне несколько советов о том, как лучше всего представить шаблоны времени в нейронной сети.