Помимо очевидных характеристик классификатора, таких как
- вычислительные затраты,
- ожидаемые типы данных функций / меток и
- пригодность для определенных размеров и размеров наборов данных,
Какие пять (или 10, 20?) классификаторов лучше всего опробовать на новом наборе данных, о котором еще мало что известно (например, семантика и корреляция отдельных функций)? Обычно я пробую Наивный Байес, Ближайший сосед, Дерево решений и SVM - хотя у меня нет веских оснований для этого выбора, кроме как я их знаю и в основном понимаю, как они работают.
Я думаю, что следует выбирать классификаторы, которые охватывают наиболее важные общие подходы классификации. Какой выбор вы бы порекомендовали, в соответствии с этим критерием или по любой другой причине?
ОБНОВЛЕНИЕ: альтернативной формулировкой этого вопроса может быть: «Какие общие подходы к классификации существуют и какие конкретные методы охватывают наиболее важные / популярные / перспективные?»