На графике ниже
- ось x => Размер набора данных
- ось у => Оценка перекрестной проверки
Красная линия для данных обучения
Зеленая линия для тестирования данных
В учебнике, на который я ссылаюсь, автор говорит, что точка, где красная линия и зеленая линия перекрываются, означает,
Сбор большего количества данных вряд ли повысит производительность обобщения, и мы находимся в регионе, который, скорее всего, нам не подойдет. Поэтому имеет смысл попробовать с моделью с большей вместимостью
Я не совсем понимаю смысл смелой фразы и как это происходит.
Ценю любую помощь.