Конечно, вы также должны принять решение о коэффициентах разделения для (двойной) повторной выборки ...
Однако повторная выборка обычно работает для довольно широкого диапазона коэффициентов разделения, если вы помните
- не делать упущения, если это уменьшит количество возможных отдельных прогонов
- оставьте достаточное количество обучающих примеров в самом внутреннем обучающем наборе, чтобы у алгоритма обучения была хорошая возможность создать полезную модель.
- чем больше у вас независимых дел, тем менее важны эти соображения.
А что, если вы работаете с данными более крупного масштаба (но не с большими) с 10000 <N <1000000?
Что вы можете сделать, если вы не уверены, нужна ли повторная выборка: выполните повторную выборку несколько раз. Достаточно, чтобы вы могли измерить, была ли необходима повторная выборка.
- проверьте стабильность ваших прогнозов
- проверьте стабильность параметров вашей модели
Получив эти результаты, вы можете решить, следует ли добавлять дополнительные итерации повторной выборки или все в порядке.