Я нахожу это странным, когда использую набор инструментов нейронной сети в Matlab.
Он разделил необработанные данные на три части:
- Обучающий набор
- проверочный набор
- тестовый набор
Я заметил, что во многих алгоритмах обучения или обучения данные часто делятся на 2 части: тренировочный набор и тестовый набор.
Мои вопросы:
- В чем разница между набором валидации и тестовым набором?
- Действительно ли набор валидации специфичен для нейронной сети? Или это необязательно.
- Чтобы пойти дальше, есть ли разница между проверкой и тестированием в контексте машинного обучения?
The training set is used to fit the models; the validation set is used to estimate prediction error for model selection; the test set is used for assessment of the generalization error of the final chosen model. Ideally, the test set should be kept in a “vault,” and be brought out only at the end of the data analysis.