Я знаю, что для того, чтобы получить доступ к характеристикам классификатора, мне нужно разделить данные на обучающие / тестовые наборы. Но читая это :
При оценке различных настроек («гиперпараметров») для оценщиков, таких как настройки C, которые должны быть установлены вручную для SVM, все еще существует риск перенастройки на тестовом наборе, поскольку параметры можно настраивать до тех пор, пока оценщик не будет работать оптимально. Таким образом, знания о наборе тестов могут «просочиться» в модель, а метрики оценки больше не сообщают о производительности обобщения. Чтобы решить эту проблему, еще одна часть набора данных может быть выделена в виде так называемого «набора проверки»: обучение продолжается на обучающем наборе, после чего выполняется оценка на наборе проверки и когда эксперимент кажется успешным , окончательная оценка может быть сделана на тестовом наборе.
Я вижу, что введен еще один (третий) набор проверки, что оправдано переоснащением набора тестов во время настройки гиперпараметров.
Проблема в том, что я не могу понять, как может появиться это переоснащение, и поэтому не могу понять обоснованность третьего набора.