Обратите внимание, что МТРИколичество переменных, случайно выбранных в качестве кандидатов при каждом разделении. И из этих кандидатов лучше всего выбрать расщепление. Таким образом, пропорция, которую вы упомянули, не удовлетворена полностью. Более важные переменные появляются чаще, а менее важные - реже. Таким образом, если переменная действительно очень важна, то существует большая вероятность, что она будет выбрана в дереве, и вам не нужно вносить исправления вручную. Но иногда (редко) возникает необходимость форсировать наличие некоторой переменной (независимо от ее возможной важности) в регрессии. Насколько мне известно, R пакет случайных лесов не поддерживает такую возможность. Но если эта переменная не имеет никакой корреляции с другими, вы можете сделать обычную регрессию с этой переменной в качестве одного члена, а затем запустить случайную лесную регрессию на остатках этой обычной регрессии. Если вы все еще хотите исправить возможность выбора заранее заданных переменных, тогда вам следует изменить исходный код с последующей компиляцией.