Отличный вопрос Это сложный вопрос, и используемый вами подход будет зависеть от сложности проблемы. Любая проблема, которую мы пытаемся решить, будет иметь определенную степень сложности, в просторечии определенную как «количество взаимодействующих вещей или вещей, которые необходимо учитывать». В контролируемом и неконтролируемом обучении мы указываем именно то, что нужно учитывать.
Например, в множественной линейной регрессии мы сообщаем алгоритму обучения, сколько функций следует учитывать при подборе модели (количество столбцов в вашем обучающем наборе). Та же самая ситуация сохраняется для обучения без учителя; используется четко определенный обучающий набор с явным количеством функций (в данном случае без меток).
То, с чем вы сталкиваетесь, является ситуацией, не подходящей для классификации или регрессии, потому что вы не можете точно определить количество «вещей, которые нужно учитывать». Как вы говорите, ваше проблемное пространство чрезвычайно велико. Другой способ думать об этом с точки зрения набора обучения, необходимого для изучения модели; насколько сложно представить, как выглядит тренировочный набор? В твоем случае сложно. Что именно будут содержать столбцы моего набора?
Вот почему такие приложения, как автомобили с автоматическим управлением, Atari и AlphaGo, не используют классификацию или регрессию. Невозможно знать, как будет выглядеть тренировочный набор. Вы можете попробовать, но ваша модель не сможет надежно делать сильные прогнозы (в этом случае движется). Сколько вещей вы должны рассмотреть, чтобы построить модель дорожных условий?
Вот почему существует третий тип машинного обучения - обучение с подкреплением. Вместо того, чтобы использовать заранее определенный обучающий набор, он использует метод проб и ошибок. Постоянно копаясь в окружающей среде, он может выучить политику, которая работает в долгосрочной перспективе.
Таким образом, для небольших проблемных пространств, где у нас есть шанс определить тренировочный набор, мы используем контролируемое и неконтролируемое машинное обучение. Для больших проблемных пространств, где сложно определить тренировочный набор, мы используем обучение с подкреплением. Конечно, вы также можете сделать интересные комбинации всех вышеперечисленных подходов, но это все еще сводится к сложности.