Предположим, я обучил несколько моделей на тренировочном наборе, выбрал лучшую, используя набор перекрестной проверки, и измерил производительность на тестовом наборе. Так что теперь у меня есть одна последняя лучшая модель. Должен ли я переучивать его на всех имеющихся у меня данных или судовом решении, обученном только на тренировочном наборе? Если последнее, то почему?
ОБНОВЛЕНИЕ: Как отметил @ P.Windridge, доставка переобученной модели в основном означает доставку модели без проверки. Но мы можем сообщать о производительности тестового набора и после этого переучивать модель на полных данных, справедливо ожидая, что производительность будет лучше - потому что мы используем нашу лучшую модель и больше данных. Какие проблемы могут возникнуть из-за такой методологии?