Методы повторного отбора карета


20

Я использую библиотеку caretв R для тестирования различных процедур моделирования.

trainControlОбъект позволяет указать метод повторной дискретизации. Эти методы описаны в документации разделе 2.3 , и включают в себя: boot, boot632, cv, LOOCV, LGOCV, repeatedcvи oob. Хотя некоторые из них легко вывести, не все эти методы четко определены.

Какие процедуры соответствуют этим методам повторной выборки?


ссылка на документацию не работает. Используйте это вместо этого.
Викас

Ответы:


20

Хорошо, вот моя попытка:


1
Я считаю, что LGOCV - это случайное разбиение между обучающим набором и проверочным набором, повторяемое n раз. Таким образом, вместо обычного случая разделения данных между поездом и удержанием (построение модели на поезде и проверка на удержание) один раз, этот процесс повторяется много раз.
B_Miner

3
Я также полагаю, что повторный CV - это k-кратная перекрестная проверка, выполненная несколько раз.
B_Miner

Трудно поверить, что это нигде не задокументировано.
Андрей

4

repeatedcvПовторяется 10-кратная кросс-проверка наверняка, согласно презентации Max Куна. Схема повторной выборки по умолчанию является начальной загрузкой.

Хорошим файлом, который вы можете посмотреть о методах пересэмплирования, является Predictive Modeling с R и пакетом каретки ( pdf ). Макс представил это в «useR! 2013».

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.