Основная идея заключается в процедуре упаковки, а не в том, чтобы деревья были случайными. Подробно каждое дерево построено на выборке объектов, нарисованных с заменой из исходного набора; таким образом, у каждого дерева есть некоторые объекты, которые он не видел, что делает весь ансамбль более разнородным и, следовательно, лучше обобщающим.
Кроме того, деревья ослабляются таким образом, что на каждом разбиении mtry
учитываются только M (или ) случайно выбранных атрибутов; M обычно является квадратным корнем числа атрибутов в наборе. Это гарантирует, что деревья меньше перегружены, так как они не обрезаны. Вы можете найти более подробную информацию здесь .
С другой стороны, существует вариант RF под названием Extreme Random Forest, в котором деревья создаются случайным образом (оптимизация разбиений отсутствует) - обратитесь, я думаю, к этой ссылке .