Опоздал на вечеринку, но в любом случае вот мой ответ, и это «Да», всегда следует беспокоиться о коллинеарности, независимо от того, является ли модель / метод линейным или нет, или основной задачей является прогноз или классификация.
Предположим, что в качестве метода используется ряд линейно коррелированных ковариат / признаков, присутствующих в наборе данных, и случайный лес. Очевидно, что при случайном выборе на узел могут быть выбраны только (или в основном) коллинеарные элементы, которые могут / будут приводить к плохому расщеплению, и это может происходить многократно, что негативно влияет на производительность.
Теперь коллинеарные элементы могут быть менее информативными в отношении результата, чем другие (неколлинеарные) элементы, и поэтому их следует учитывать для исключения из набора функций в любом случае. Тем не менее, предположим, что функции ранжируются высоко в списке «Важность функций», составленном RF. Как таковые они будут храниться в наборе данных, без необходимости увеличивая размерность. Таким образом, на практике, я всегда, в качестве исследовательского шага (из многих связанных) проверяю парную связь признаков, включая линейную корреляцию.