Фридман, Хасти и Тибширани (2010) , ссылаясь на «Элементы статистического обучения» , напишите:
Мы часто используем правило «одной стандартной ошибки» при выборе лучшей модели; это признает тот факт, что кривые риска оцениваются с ошибкой, поэтому ошибки на стороне скупости.
Причина использования одной стандартной ошибки, в отличие от любой другой суммы, по-видимому, в том, что она, ну ... стандартная. Krstajic и др. (2014) пишут (выделено жирным шрифтом):
Брейман и др. [25] обнаружили, что в случае выбора оптимального размера дерева для моделей дерева классификации, размер дерева с минимальной ошибкой перекрестной проверки генерирует модель, которая в общем случае подходит. Поэтому в разделе 3.4.3 их книги Breiman et al. [25] определяют одно стандартное правило ошибки (правило 1 SE) для выбора оптимального размера дерева и реализуют его на протяжении всей книги. Чтобы рассчитать стандартную ошибку для одиночной V-кратной перекрестной проверки, точность должна быть рассчитана для каждого сгиба, а стандартная ошибка рассчитана из V точности для каждого сгиба. Hastie et al. [4] определяют правило 1 SE как выбор наиболее экономной модели, чья ошибка не более чем на одну стандартную ошибку выше ошибки лучшей модели, и предлагают в нескольких местах использовать правило 1 SE для общего использования перекрестной проверки.Суть правила 1 SE, с которым мы согласны, заключается в выборе простейшей модели, точность которой сопоставима с лучшей моделью .
λ