Я часто нахожу себя обучающим несколько различных прогностических моделей с использованием caret
R. Я тренирую их все по одним и тем же сгибам перекрестной проверки, используя caret::: createFolds
, а затем выбираю лучшую модель, основанную на перекрестно проверенной ошибке.
Тем не менее, медианный прогноз из нескольких моделей часто превосходит лучшую единственную модель в независимом наборе тестов. Я подумываю о том, чтобы написать некоторые функции для стекирования / ансамблирования каретных моделей, которые были обучены с одинаковыми сгибами перекрестной проверки, например, принимая срединные прогнозы из каждой модели в каждом сгибе или обучая «метамодель».
Конечно, для этого может потребоваться внешний цикл перекрестной проверки. Кто-нибудь знает какие-либо существующие пакеты / открытый исходный код для ансамбля каретных моделей (и, возможно, перекрестной проверки этих ансамблей)?