Я понимаю, что в модели деревьев повышения есть 3 параметра настройки, т.е.
- количество деревьев (количество итераций)
- параметр усадки
- количество разбиений (размер каждого составляющего дерева)
У меня вопрос: для каждого из параметров настройки, как мне найти его оптимальное значение? А какой метод?
Обратите внимание: параметр усадки и параметр количества деревьев работают вместе, т. Е. Меньшее значение параметра усадки приводит к увеличению значения числа деревьев. И мы должны это учитывать.
Я особенно заинтересован в методе, чтобы найти оптимальное значение для числа разделений. Должно ли оно основываться на перекрестной проверке или знании предметной области модели?
И как эти вещи осуществляются в gbm
пакете в R?