Я предполагаю, что вы имеете в виду выбор функции как проектирование . Процесс, которым я обычно следую, и я вижу, что некоторые люди делают это
- Характеристика техники
Попробуйте использовать некоторые алгоритмы, обычно с высокой производительностью, такие как RandomForest, Gradient Boosted Trees, Neutral Networks или SVM.
2.1. Выполните простую настройку параметров, такую как поиск по сетке для небольшого диапазона параметров.
Если результат шага 2 не является удовлетворительным, вернитесь к шагу 1, чтобы создать больше функций, или удалите избыточные функции и оставьте лучшие, люди обычно называют этот выбор функций . Если не хватает идей для новых функций, попробуйте больше алгоритмов.
Если результат в порядке или близок к желаемому, переходите к шагу 3
- Обширная настройка параметров
Причиной этого является то, что классификация - это все о разработке функций , и если вы не знаете какой-то невероятно мощный классификатор, такой как глубокое обучение, настроенный для конкретной задачи, такой как Computer Vision. Генерация хороших функций является ключом. Выбор классификатора важен, но не критичен. Все упомянутые выше классификаторы вполне сопоставимы с точки зрения производительности, и в большинстве случаев лучшим классификатором оказывается один из них.
Настройка параметров может повысить производительность, в некоторых случаях, довольно много. Но без хороших функций настройка не очень помогает. Имейте в виду, у вас всегда есть время для настройки параметров. Кроме того, нет смысла настраивать параметры, тогда вы обнаружите новую функцию и переделаете все это.