Алгоритмы машинного обучения для панельных данных


12

В этом вопросе. Существует ли метод построения деревьев решений, который учитывает структурированные / иерархические / многоуровневые предикторы? - они упоминают метод данных панели для деревьев.

Существуют ли специальные методы данных панели для поддержки векторных машин и нейронных сетей? Если да, не могли бы вы привести несколько статей для алгоритмов и (если они есть) пакетов R, реализующих его?


1
Мне было интересно, что вы решили использовать для этого? Пытаюсь решить похожую проблему.
user0

Ответы:


1

LSTM (долговременная кратковременная память) может иметь отношение к вам. Этот тип модели может обрабатывать несколько объектов в разные моменты времени, которые должны соответствовать данным панели. Вот очень хорошее объяснение концепции LSTM, и здесь это пакет , который реализует R версию LSTM.


1

Если у вас есть данные панели, есть разные задачи, которые вы можете попытаться решить, например, классификация / регрессия временных рядов или прогнозирование панели. И для каждой задачи существует множество подходов к ее решению.

Когда вы хотите использовать методы машинного обучения для решения задач прогнозирования, существует несколько подходов:

Что касается ваших входных данных (X), обработки единиц (например, стран, отдельных лиц и т. Д.) В качестве образцов iid, вы можете

  • bin временных рядов и обрабатывать каждый бин как отдельный столбец, игнорируя любое временное упорядочение, с равными бинами для всех единиц, размер бина, конечно, может быть просто измерением наблюдаемого временного ряда, или вы можете увеличить выборку и объединить в большие бины, а затем использовать стандартные алгоритмы машинного обучения для табличных данных,
  • или извлекать объекты из временного ряда для каждого блока и использовать каждый извлеченный объект в виде отдельных столбцов, снова в сочетании со стандартными табличными алгоритмами,
  • или использовать специализированные алгоритмы регрессии / классификации временных рядов в зависимости от того, наблюдаете ли вы непрерывные или категориальные данные временных рядов, это включает машины опорных векторов со специальными ядрами, которые сравнивают временные ряды с временными рядами.

Что касается ваших выходных данных (у), если вы хотите прогнозировать несколько временных точек в будущем, вы можете

  • установить оценку для каждого шага вперед, который вы хотите прогнозировать, всегда используя одни и те же входные данные,
  • или подберите один оценщик для первого шага вперед и в прогнозировании сверните входные данные во времени, используя прогнозы первого шага, чтобы добавить к наблюдаемым входным данным, чтобы сделать прогнозы второго шага и так далее.

Все вышеперечисленные подходы в основном сводят проблему панельного прогнозирования к регрессии временного ряда или табличной регрессии. Когда ваши данные находятся в формате временных рядов или табличной регрессии, вы также можете добавлять любые неизменяемые во времени функции для пользователей.

Конечно, есть и другие варианты решения проблемы панельного прогнозирования, например, использование классических методов прогнозирования, таких как ARIMA, адаптированных для панельных данных, или методов глубокого обучения, которые позволяют напрямую составлять последовательности для последовательных прогнозов.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.