Итак, я новичок в области ОД и пытаюсь провести некоторую классификацию. Моя цель - предсказать исход спортивного события. Я собрал некоторые исторические данные и сейчас пытаюсь обучить классификатор. Я получил около 1200 сэмплов, 0,2 из которых я разделил для целей тестирования, другие я включил в поиск по сетке (включая перекрестную проверку) с различными классификаторами. Я пробовал SVM с линейными, rbf и полиноминальными ядрами и случайными лесами на данный момент. К сожалению, я не могу получить точность значительно больше 0,5 (так же, как при случайном выборе класса). Значит ли это, что я просто не могу предсказать исход такого сложного события? Или я могу получить точность не менее 0,7-0,8? Если это возможно, то что я должен смотреть дальше?
- Получить больше данных? (Я могу увеличить набор данных до 5 раз)
- Попробуйте разные классификаторы? (Логистическая регрессия, кНН и т. Д.)
- Переоценить мой набор функций? Существуют ли ML-инструменты для анализа, какие функции имеют смысл, а какие нет? Может быть, я должен уменьшить свой набор функций (в настоящее время у меня есть 12 функций)?