K-кратная перекрестная проверка (CV) случайным образом разбивает ваши данные на K разделов, и вы, в свою очередь, протягиваете одну из этих K частей в качестве контрольного примера, а другие части K-1 объединяете в свои тренировочные данные. Leave One Out (LOO) - это особый случай, когда вы берете свои N данных и делаете N-кратное резюме. В некотором смысле, Hold Out - это еще один особый случай, когда вы выбираете только один из ваших K-сгибов в качестве теста и не поворачиваете все K-сгибы.
Насколько мне известно, 10-кратное резюме является в значительной степени достоинством, поскольку оно эффективно использует ваши данные и помогает избежать неудачного выбора раздела. Hold Out не позволяет эффективно использовать ваши данные, и LOO не такой надежный (или что-то в этом роде), но 10-кратное смещение - это как раз то, что нужно.
Если вы знаете, что ваши данные содержат более одной категории, а одна или несколько категорий намного меньше остальных, некоторые из ваших K случайных разделов могут вообще не содержать ни одной из маленьких категорий, что было бы плохо. Чтобы убедиться, что каждый раздел достаточно репрезентативен, вы используете стратификацию: разбейте данные на категории, а затем создайте случайные разделы, выбирая случайным образом и пропорционально из каждой категории.
Все эти варианты K-fold CV выбирают из ваших данных без замены. Загрузчик выбирает данные с заменой, поэтому один и тот же элемент данных может быть включен несколько раз, а некоторые данные могут быть вообще не включены. (Каждый «раздел» также будет иметь N элементов, в отличие от K-fold, в котором каждый раздел будет иметь N / K элементов.)
(Я должен признать, что я не знаю точно, как будет использоваться начальная загрузка в CV. Принцип тестирования и CV - убедиться, что вы не проверяете данные, на которых вы тренировались, поэтому вы получаете более реалистичное представление о том, как ваша техника + коэффициенты могут работать в реальном мире.)
РЕДАКТИРОВАТЬ: Заменить «Удержание не является эффективным» с «Удержание не позволяет эффективно использовать ваши данные», чтобы помочь разъяснить, в соответствии с комментариями.