Укладка / сборка моделей с кареткой


21

Я часто нахожу себя обучающим несколько различных прогностических моделей с использованием caretR. Я тренирую их все по одним и тем же сгибам перекрестной проверки, используя caret::: createFolds, а затем выбираю лучшую модель, основанную на перекрестно проверенной ошибке.

Тем не менее, медианный прогноз из нескольких моделей часто превосходит лучшую единственную модель в независимом наборе тестов. Я подумываю о том, чтобы написать некоторые функции для стекирования / ансамблирования каретных моделей, которые были обучены с одинаковыми сгибами перекрестной проверки, например, принимая срединные прогнозы из каждой модели в каждом сгибе или обучая «метамодель».

Конечно, для этого может потребоваться внешний цикл перекрестной проверки. Кто-нибудь знает какие-либо существующие пакеты / открытый исходный код для ансамбля каретных моделей (и, возможно, перекрестной проверки этих ансамблей)?

Ответы:


19

Похоже, Макс Кун действительно начал работать над пакетом для ансамблевых моделей карет , но еще не успел его закончить. Это именно то, что я искал. Я надеюсь, что проект закончится в один прекрасный день!

изменить: я написал свой собственный пакет для этого: caretEnsemble


1
Отличная работа над этим пакетом!
mikeycgto

8

То, что вы ищете, называется "ансамбль моделей". Простое вводное руководство с кодом R можно найти здесь: http://viksalgorithms.blogspot.jp/2012/01/intro-to-ensemble-learning-in-r.html


3
Не быть придирчивым, но «ансамбль» прямо в заголовке моего поста. Я очень конкретно ищу R-пакет для объединения произвольных моделей, которого, кажется, не существует. Спасибо за размещение кода, хотя. Может быть, я напишу свой собственный пакет!
Зак

1

Я не совсем уверен, что вы ищете, но это может помочь: http://www.jstatsoft.org/v28/i05/paper

Это как использовать несколько моделей в карете. Часть, которая может вас заинтересовать - это раздел 5 на стр. 13.


То, что я ищу, - это пакет, который будет принимать в качестве входных данных список объектов каретки, а затем будет выводить среднее, среднее или средневзвешенное значение их прогнозов. Более продвинутые функциональные возможности могут включать оптимизацию весов посредством перекрестной проверки.
Зак
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.