Давайте рассмотрим проблему классификации набора данных MNIST.
Согласно веб -странице MNIST Яна ЛеКуна , «Ciresan et al.» получил 0,23% ошибок в тестовом наборе MNIST с использованием сверточной нейронной сети.
Давайте обозначим обучающий набор MNIST как , тестовый набор MNIST как , окончательную гипотезу, которую они получили, используя качестве , и их частоту ошибок в тестовом наборе MNIST, используя как .
С их точки зрения, поскольку - это набор тестов с произвольной выборкой из входного пространства независимо от , они могут настаивать на том, что показатель ошибок вне выборки их окончательной гипотезы равен ограниченный как следует из неравенства Хеффдинга где, ч 1 Е о у т ( ч 1 ) Р [ | E о у т ( ч 1 ) - E т е с т ( ч 1 ) | < ϵ | ] ≥ 1 - 2 e 2 ϵ 2 N t e s t N t e s t = |
Другими словами, по крайней мере, вероятность ,
Давайте рассмотрим другую точку зрения. Предположим, что кто-то хочет хорошо классифицировать набор тестов MNIST. Поэтому он сначала заглянул на веб-страницу MNIST Яна ЛеКуна и обнаружил следующие результаты, полученные другими людьми, использующими 8 разных моделей:
и выбрал свою модель которая показала лучшие результаты на тестовом наборе MNIST среди 8 моделей.
Для него в процессе обучения была выбрана гипотеза которая лучше всего работала на наборе тестов из набора гипотез .
Таким образом, ошибка в тестовом наборе является ошибкой «в выборке» для этого процесса обучения, поэтому он может применить оценку VC для конечных наборов гипотез в виде следующего неравенства.
Другими словами, по крайней мере, вероятность ,
Этот результат подразумевает, что на тестовом наборе может возникнуть перегрузка, если мы выберем модель, которая работает лучше всего среди нескольких моделей.
В этом случае человек может выбрать с самой низкой частотой ошибок . Поскольку является лучшей гипотезой среди 8 моделей в этом конкретном наборе тестов , может существовать некоторая вероятность того, что является гипотезой, переопределенной в наборе тестов MNIST.
Таким образом, этот человек может настаивать на следующем неравенстве.
Следовательно, мы получили два неравенства and .
Однако очевидно, что эти два неравенства несовместимы.
Где я делаю не так? Кто из них прав, а кто нет?
Если последнее неверно, как правильно применить оценку VC для конечных наборов гипотез в этом случае?