Перекрестная проверка с опущением один раз, как правило, не приводит к лучшей производительности, чем K-кратная, и, скорее всего, будет хуже , поскольку она имеет относительно высокую дисперсию (т. Е. Ее значение изменяется для разных выборок данных больше, чем значение для k-кратная перекрестная проверка). Это плохо в критерии выбора модели, так как это означает, что критерий выбора модели можно оптимизировать способами, которые просто используют случайное отклонение в конкретной выборке данных, а не вносят подлинные улучшения в производительность, т.е. критерий выбора модели. Причина, по которой перекрестная проверка по принципу «один-один-один» используется на практике, заключается в том, что для многих моделей она может быть оценена очень дешево как побочный продукт подбора модели.
Если вычислительные затраты не являются в первую очередь проблемой, лучшим подходом является выполнение повторной перекрестной проверки в k-кратном порядке, где процедура перекрестной проверки в k-кратном режиме повторяется с различными случайными разбиениями на k непересекающихся подмножеств каждый раз. Это уменьшает дисперсию.
Если у вас есть только 20 шаблонов, очень вероятно, что вы столкнетесь с чрезмерным соответствием критерию выбора модели, который представляет собой заброшенную ловушку в статистике и машинном обучении (бесстыдный плагин: см. Мою статью по теме). Возможно, вам будет лучше выбрать относительно простую модель и постараться не очень агрессивно ее оптимизировать, либо использовать байесовский подход и усреднить все варианты моделей, взвешенные по их вероятности. ИМХО оптимизация - корень всего зла в статистике, поэтому лучше не оптимизировать, если вам это не нужно, и оптимизировать с осторожностью, когда вы это делаете.
Также обратите внимание, что если вы собираетесь выполнять выбор модели, вам нужно использовать что-то вроде вложенной перекрестной проверки, если вам также нужна оценка производительности (т.е. вы должны рассматривать выбор модели как неотъемлемую часть процедуры подбора модели и перекрестной проверки, что также).