Я читал о проверке K-Fold, и я хочу убедиться, что я понимаю, как это работает.
Я знаю, что для метода удержания данные делятся на три набора, и набор тестов используется только в самом конце для оценки производительности модели, в то время как набор проверки используется для настройки гиперпараметров и т. Д.
В методе k-сгибаем ли мы до сих пор сохраняем тестовый набор для самого конца и используем только оставшиеся данные для обучения и настройки гиперпараметра, т.е. мы разбиваем оставшиеся данные на k сгибов, а затем используем среднюю точность после обучения с каждым сгибом (или какой-либо метрикой производительности, которую мы выбираем для настройки наших гиперпараметров)? Или мы вообще не используем отдельный набор тестов, а просто разбиваем весь набор данных на k сгибов (если это так, я предполагаю, что мы просто считаем среднюю точность по k сгибам нашей конечной точностью)?