В базовом машинном обучении нас учат следующим «правилам большого пальца»:
а) размер ваших данных должен как минимум в 10 раз превышать размер VC вашего набора гипотез.
б) нейронная сеть с N соединениями имеет размерность VC приблизительно N.
Итак, когда в нейронной сети с глубоким обучением говорят, миллионы единиц, значит ли это, что мы должны иметь, скажем, миллиарды точек данных? Не могли бы вы пролить свет на это?