Вопросов:
- В чем разница (ы) между деревьями регрессионного усиления (BRT) и обобщенными моделями (GBM)? Могут ли они быть взаимозаменяемыми? Является ли одна конкретная форма другой?
- Почему Риджуэй использовал фразу «Обобщенные модели ускоренной регрессии» (GBM), чтобы описать то, что Фридман ранее предлагал как «Машина повышения градиента» (GBM)? Эти две аббревиатуры идентичны, описывают одно и то же, но происходят из разных фраз.
Фон:
У меня проблемы с определением различий между терминами BRT и GBM. Из того, что я понимаю, оба являются терминами, описывающими деревья классификации и регрессии, которые имеют стохастичность, включенную посредством некоторого повышения (например, суммирование, начальная загрузка, перекрестная проверка). Кроме того, из того, что я понял, термин GBM был впервые введен Фридманом (2001) в его работе «Приближение функции жадности: машина повышения градиента». Затем Риджуэй реализовал процедуру, описанную Фридманом в 2006 году в его пакете «Обобщенные модели ускоренной регрессии» (GBM). В моей области (экология) Elith et al. (2008) был первым, кто продемонстрировал gbm
пакет Ridgeway для моделирования распространения видов. Однако авторы в Elith et al. использовать термин «ускоренное регрессионное дерево» (BRT) для описания Фридмана и Риджуэя »
Я не понимаю, могут ли эти термины использоваться взаимозаменяемо? Несколько странно, что один автор использовал бы ту же аббревиатуру (из другой фразы) для описания той же теории, что и предыдущий автор. Также сбивает с толку тот факт, что третий автор использовал совершенно другой термин при описании этой теории в экологических терминах.
Лучшее, что я могу придумать, это то, что BRT - это особая форма GBM, в которой распределение является биномиальным, но я не уверен в этом.
Элит и соавт. определить деревья регрессионного ускорения следующим образом: «Деревья бустерной регрессии сочетают в себе сильные стороны двух алгоритмов: деревьев регрессии (моделей, которые связывают отклик с их предикторами с помощью рекурсивного двоичного разбиения) и бустинга (адаптивный метод для объединения многих простых моделей для повышения эффективности прогнозирования). ). Конечную модель BRT можно понимать как модель аддитивной регрессии, в которой отдельные термины являются простыми деревьями, подходящими поэтапно, вперёд »(Elith et al. 2008).