Может ли кто-нибудь объяснить разницу между RandomForestClassifier и ExtraTreesClassifier в scikit learn. Я потратил немало времени на чтение статьи:
П. Гертс, Д. Эрнст. И Л. Вехенкель, «Чрезвычайно рандомизированные деревья», Машинное обучение, 63 (1), 3-42, 2006 г.
Кажется, в этом разница для ET:
1) При выборе переменных в разбиении выборки берутся из всего обучающего набора вместо начальной выборки обучающего набора.
2) Сплиты выбираются полностью случайным образом из диапазона значений в выборке при каждом разбиении.
В результате этих двух вещей намного больше «листьев».