У меня есть данные с несколькими тысячами функций, и я хочу сделать рекурсивный выбор функций (RFE), чтобы удалить неинформативные. Я делаю это с помощью карета и РСЕ. Однако я начал думать, если я хочу получить наилучшее соответствие регрессии (например, случайный лес), когда мне следует выполнить настройку параметров ( mtry
для RF)? То есть, как я понимаю, карета многократно тренирует RF на разных подмножествах функций с фиксированным mtry. Я полагаю, что оптимум mtry
должен быть найден после завершения выбора функции, но повлияет ли mtry
значение, которое использует каретка, на выбранный набор функций? Использование каретки с низкой mtry
скоростью, конечно, намного быстрее.
Надеюсь, кто-нибудь сможет мне это объяснить.