Если я уже нашел функцию минимальной стоимости в подмножестве проверки, зачем мне нужно проверять ее снова в подмножестве проверки
Из-за случайной ошибки: Обычно у вас есть только конечное число случаев.
Оптимизация производительности валидации (внутреннего теста) означает, что вы можете использовать этот внутренний тестовый набор. Внутренний набор тестов способствует оценке окончательной модели и, таким образом, не зависит от модели.
Это означает, что вам нужно иметь другой (внешний) набор тестов, который не зависит от всей процедуры моделирования (включая все процессы предварительной обработки и оптимизации на основе данных или выбора модели), если вы хотите оценить свойства обобщения.
Я рекомендую вам сделать симуляцию и сравнить три различные оценки ошибок, которые вы можете иметь
- resubstitution: прогнозирование поезда набор
МЕРЫ Совершенство-о-приступе
- набор внутренних тестов (в вашей номенклатуре: валидация): качество, которое, по мнению оптимизатора, достигнуто
- внешний тестовый набор: ошибка обобщения, независимая от обучения модели.
В симуляции вы можете легко сравнить их с правильным, большим, независимо сгенерированным набором тестов. Если установка правильная, внешний тест должен быть беспристрастным (по сравнению с суррогатной моделью, которую он оценивает, а не по «окончательной» модели, построенной на всем наборе данных). Внутренний тест обычно смещен оптимистично, а повторное замещение еще более смещено оптимистично.
В моей области внутренний тест легко недооценил бы ошибку обобщения в 2 - 5 раз (намного больше для агрессивных схем оптимизации).
Примечание: номенклатура множеств не является универсальной. В моей области (аналитическая химия) валидация обычно означает подтверждение эффективности последней процедуры - таким образом, больше того, что делает ваш «тестовый» набор, чем то, что делает ваш «тестовый» набор.
Поэтому я предпочитаю говорить о внутренних и внешних наборах тестов или о наборе тестов оптимизации (= внутреннем наборе тестов), и тогда набор валидации будет означать внешний набор тестов.