Я довольно новичок в случайных лесах. В прошлом я всегда сравнивал точность подгонки к тесту с подгонкой к тренировке, чтобы обнаружить любое переоснащение. Но я только что прочитал здесь, что:
«В случайных лесах нет необходимости в перекрестной проверке или отдельном наборе тестов, чтобы получить объективную оценку ошибки набора тестов. Она оценивается внутри, во время прогона…»
Небольшой абзац выше можно найти в разделе « Оценка ошибок из пакета» . Эта концепция ошибки вне пакета совершенно нова для меня, и немного сбивает с толку то, как ошибка OOB в моей модели составляет 35% (или точность 65%), но, тем не менее, если я применяю перекрестную проверку к моим данным (простая задержка метод) и сравнить оба теста на соответствие и тест на соответствие, я получаю точность 65% и точность 96% соответственно. По моему опыту, это считается переоснащением, но OOB содержит ошибку 35%, так же как и моя ошибка сравнения с тестом . Я переоснащаюсь? Должен ли я даже использовать перекрестную проверку для проверки соответствия в случайных лесах?
Короче говоря, я не уверен, должен ли я доверять OOB, чтобы получить непредвзятую ошибку ошибки набора тестов, когда моя подгонка против поезда указывает, что я переоснащаюсь!