Я пытался понять, как представлять и формировать данные для составления многомерного и многомерного прогноза временных рядов с использованием Keras (или TensorFlow), но я все еще очень неясен после прочтения многих постов / учебников / документации в блоге о том, как представлять данные в правильная форма (большинство примеров немного меньше
Мой набор данных:
- несколько городов
- для которого у меня есть информация о, скажем, температуре, автомобильном движении, влажности
- скажем, последние 2 года (одна запись на каждый день)
Что я хочу сделать: я хотел бы прогнозировать для каждого города температуры, которые я могу ожидать в следующем году, используя, возможно, запаздывающую версию температуры, автомобильного движения и влажности (конечно, было бы еще несколько функций, но это всего лишь пример для размышления).
Что меня смущает: если у меня есть 2 города, для которых я записал 3 функции в течение 365 дней. Как мне сформировать свои данные, чтобы модель могла выводить прогноз на 365 дней для этих двух городов (т.е. 2 временных ряда температур на 365 дней)?
Интуитивно понятно, что тензорная форма будет (?, 365, 3)
на 365 дней и 3 функции. Но я не уверен, что придерживаться первого измерения, и, самое главное, я был бы удивлен, если бы это было для числа городов. Но в то же время я понятия не имею, как указать в модели, что она должна правильно понимать размеры.
Любые указатели будут полезны. Я довольно хорошо знаком с остальной проблемой (то есть, как вы строите сеть в Keras и т. Д., Поскольку я сделал это для других нейронных сетей, но более конкретно, как лучше кодировать последовательность для желаемого ввода).
Да, и также , я думаю, я мог бы тренироваться и прогнозировать для каждого города независимо, но я уверен, что все согласятся, что есть вещи, которые, возможно, следует изучить, которые не характерны для какого-либо города, но это можно увидеть только при рассмотрении нескольких из них, поэтому я считаю, что важно кодировать его в модели.