Я думаю, что это простой вопрос, хотя причины, почему или почему нет, могут и не быть. Причина, по которой я спрашиваю, состоит в том, что я недавно написал свою собственную реализацию RF, и, хотя она работает хорошо, она работает не так, как я ожидал (на основе набора данных о конкурсе Kaggle Photo Quality Prediction , победных баллов и некоторых последующая информация о том, какие методы были использованы).
Первое, что я делаю в таких обстоятельствах, - это ошибка прогнозирования графика для моей модели, поэтому для каждого заданного значения прогнозирования я определяю среднее отклонение (или отклонение) от правильного целевого значения. Для моего РФ я получил этот участок:
Мне интересно, является ли это обычно наблюдаемой моделью смещения для RF (если нет, то это может быть что-то конкретное для набора данных и / или моей реализации). Я, конечно, могу использовать этот график для улучшения прогнозов, используя его для компенсации смещения, но мне интересно, есть ли более фундаментальная ошибка или недостаток в самой модели RF, которая требует устранения. Спасибо.
== ДОБАВЛЕНИЕ ==
Мое первоначальное расследование в этой записи блога Случайный лесной уклон - Обновление