Случайные леса для многомерной регрессии


23

У меня проблема регрессии с несколькими выходами с входными функциями и выходными . Выходы имеют сложную нелинейную корреляционную структуру.dxdy

Я хотел бы использовать случайные леса, чтобы сделать регрессию. Насколько я могу судить, случайные леса для регрессии работают только с одним выходом, поэтому мне пришлось бы тренировать случайные леса - по одному на каждый выход. Это игнорирует их корреляции.dy

Существует ли расширение для случайных лесов, которое учитывает выходные корреляции? Может быть, что-то вроде регрессии Гаусса для многозадачного обучения .


4
вот что я смог выкопать до сих пор: scikit-learn.org/dev/modules/tree.html#multi-output-problems
sergeyf

1
конечно. У меня есть «мерные» изображения (на самом деле спектры dI / dV) пептидов. цель состоит в том, чтобы выяснить расположение и классы аминокислот, из которых состоит пептид. Моим первым подходом была сегментация изображения, но CRF и пиксельные случайные леса потерпели неудачу. так что теперь, вместо того, чтобы говорить, что каждый пиксель «принадлежит» одной и только одной аминокислоте (не совсем верно), я назначаю каждому пикселю относительное значение «влияния» от соседних аминокислот. это приводит к размерной гистограмме dy для каждого пикселя. следовательно, множественная выходная регрессия!
сергейф

1
Это может быть запоздалый ответ: в Crimisini et al. Леса принятия решений: единая основа для классификации, регрессии, оценки плотности, коллекторов. Изучение того, что они используют RF таким образом, который вам подходит для идентификации границ органов.
Симона

4
Это может быть и поздно, но может помочь любому, кто наткнется на этот пост. Случайный лес можно легко обучить с использованием многомерных данных. Все происходит одинаково, однако вместо использования дисперсии для расчета прироста информации мы используем ковариацию нескольких выходных переменных. И что более важно, листья теперь содержат N-мерные PDF-файлы.
Масад

1
Я не знаю, что РФ "Это игнорирует их корреляции". Учитывая ансамблевую природу РФ, я думаю, что они могут объяснить корреляции. Если бы они брали одномерный вход и давали одномерный результат, то они не учитывали бы корреляции.
EngrStudent - Восстановить Монику

Ответы:



Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.