Недавно я натолкнулся на статью, в которой предлагается использовать классификатор k-NN для конкретного набора данных. Авторы использовали все доступные образцы данных, чтобы выполнить перекрестную проверку в k-кратном размере для различных значений k и сообщить результаты перекрестной проверки наилучшей конфигурации гиперпараметра.
Насколько мне известно, этот результат является предвзятым, и они должны были сохранить отдельный набор тестов для получения оценки точности образцов, не используемых для оптимизации гиперпараметров.
Я прав? Можете ли вы предоставить некоторые ссылки (предпочтительно исследовательские работы), которые описывают это неправильное использование перекрестной проверки?