Если у вас есть данные панели, есть разные задачи, которые вы можете попытаться решить, например, классификация / регрессия временных рядов или прогнозирование панели. И для каждой задачи существует множество подходов к ее решению.
Когда вы хотите использовать методы машинного обучения для решения задач прогнозирования, существует несколько подходов:
Что касается ваших входных данных (X), обработки единиц (например, стран, отдельных лиц и т. Д.) В качестве образцов iid, вы можете
- bin временных рядов и обрабатывать каждый бин как отдельный столбец, игнорируя любое временное упорядочение, с равными бинами для всех единиц, размер бина, конечно, может быть просто измерением наблюдаемого временного ряда, или вы можете увеличить выборку и объединить в большие бины, а затем использовать стандартные алгоритмы машинного обучения для табличных данных,
- или извлекать объекты из временного ряда для каждого блока и использовать каждый извлеченный объект в виде отдельных столбцов, снова в сочетании со стандартными табличными алгоритмами,
- или использовать специализированные алгоритмы регрессии / классификации временных рядов в зависимости от того, наблюдаете ли вы непрерывные или категориальные данные временных рядов, это включает машины опорных векторов со специальными ядрами, которые сравнивают временные ряды с временными рядами.
Что касается ваших выходных данных (у), если вы хотите прогнозировать несколько временных точек в будущем, вы можете
- установить оценку для каждого шага вперед, который вы хотите прогнозировать, всегда используя одни и те же входные данные,
- или подберите один оценщик для первого шага вперед и в прогнозировании сверните входные данные во времени, используя прогнозы первого шага, чтобы добавить к наблюдаемым входным данным, чтобы сделать прогнозы второго шага и так далее.
Все вышеперечисленные подходы в основном сводят проблему панельного прогнозирования к регрессии временного ряда или табличной регрессии. Когда ваши данные находятся в формате временных рядов или табличной регрессии, вы также можете добавлять любые неизменяемые во времени функции для пользователей.
Конечно, есть и другие варианты решения проблемы панельного прогнозирования, например, использование классических методов прогнозирования, таких как ARIMA, адаптированных для панельных данных, или методов глубокого обучения, которые позволяют напрямую составлять последовательности для последовательных прогнозов.