[ИЗМЕНЕНО в свете комментария]
Я думаю, что есть проблема, если вы используете результаты CV для выбора среди нескольких моделей.
CV позволяет вам использовать весь набор данных для обучения и тестирования одной модели / метода, а также иметь разумное представление о том, насколько хорошо он будет обобщаться. Но если вы сравниваете несколько моделей, мой инстинкт заключается в том, что при сравнении моделей используется дополнительный уровень изоляции теста поезда, который дает вам CV, поэтому конечный результат не будет разумной оценкой точности выбранной модели.
Поэтому я предполагаю, что если вы создадите несколько моделей и выберете одну из них на основе ее резюме, вы будете слишком оптимистичны в отношении того, что нашли. Чтобы проверить, насколько хорошо обобщается победитель, потребуется еще один набор для проверки.