Почему бы не всегда использовать ансамблевое обучение?


13

Мне кажется, что ансамблевое обучение всегда даст лучшую прогностическую эффективность, чем с одной гипотезой обучения.

Итак, почему бы нам не использовать их все время?

Я думаю, возможно, из-за вычислительных ограничений? (даже тогда мы используем слабые предикторы, поэтому я не знаю).


2
Потому что ансамблевое обучение не всегда дает лучшую производительность. И мешки, и бустинг работают в некоторых случаях, но могут серьезно ухудшить производительность в других.
Марк Клазен

Ответы:


12

В целом это не правда, что он всегда будет работать лучше. Существует несколько методов ансамбля, каждый из которых имеет свои преимущества и недостатки. Какой из них использовать, а затем зависит от имеющейся проблемы.

Например, если у вас есть модели с высокой дисперсией (они превышают ваши данные), то вы, вероятно, выиграете от использования упаковки. Если у вас есть предвзятые модели, лучше сочетать их с Boosting. Существуют также разные стратегии формирования ансамблей. Тема слишком широка, чтобы охватить ее одним ответом.

Но моя точка зрения такова: если вы используете неправильный метод ансамбля для своих настроек, вы не добьетесь большего успеха. Например, использование Bagging с предвзятой моделью не поможет.

Кроме того, если вам нужно работать в вероятностной обстановке, ансамблевые методы также могут не работать. Как известно , что Активизации (в его наиболее популярных формах , таких как AdaBoost) обеспечивает плохие оценки вероятности. То есть, если вы хотите иметь модель, которая позволяет вам рассуждать о ваших данных, а не только о классификации, вам лучше использовать графическую модель.


Пень решения является предвзятым, но они были успешно использованы с мешками.

да, но ансамбль все еще предвзят. Что если смещение действительно является проблемой? Bagging не поможет исправить это. Не могли бы вы добавить ссылку на тот случай, который вы упомянули?
jpmuc
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.