Значение оси Y на графике частичной зависимости Random Forest


13

Я использую RandomForestпакет R и не понимаю, как интерпретировать значения оси Y на графиках их частичной зависимости. Справочные документы утверждают, что график представляет собой «графическое изображение предельного влияния переменной на вероятность класса». Тем не менее, я все еще не понимаю, что именно представляет ось Y.

  • В частности, что означают отрицательные значения?
  • Что значит иметь негативное влияние на точное предсказание класса?
  • И что является наиболее важной характеристикой этих цифр, это максимальное значение, форма тренда и т. Д.?
  • Можете ли вы сравнить частичные графики с частичными графиками других переменных?
  • Как эти графики могут сравниваться с кривыми отклика, созданными в Maxent (программное обеспечение для моделирования распределения)?

Некоторые примеры графиков частичной зависимости

Ответы:


7

Отвечая на эти два вопроса в первую очередь:

В частности, что означают отрицательные значения? Что значит иметь негативное влияние на точное предсказание класса?

Если вы посмотрите на определение того, как частичный график вычисляется в документации пакета Random Forest , он говорит, что графики показывают относительный логитный вклад переменной в вероятность класса с точки зрения модели. Другими словами, отрицательные значения (по оси Y) означают, что положительный класс менее вероятен для этого значения независимой переменной (по оси X) в соответствии с моделью. Точно так же положительные значения означают, что положительный класс более вероятен для этого значения независимой переменной в соответствии с моделью. Ясно, что ноль не подразумевает никакого среднего влияния на классовую вероятность согласно модели.

И что является наиболее важной характеристикой этих цифр, это максимальное значение, форма тренда и т. Д.?

Существует много разных подходов для определения важности функции, и максимальное абсолютное значение - это всего лишь одна простая мера. Как правило, люди смотрят на форму частичных графиков, чтобы собрать понимание того, что модель предлагает в отношении отношений от переменных к меткам классов.

Можете ли вы сравнить частичные графики с частичными графиками других переменных?

Ответ на это менее черно-белый. Вы можете определенно взглянуть на диапазон оси Y для каждого графика; Если частичная зависимость от одной переменной близка к нулю для всего диапазона переменной, это говорит о том, что модель не имеет никакого отношения от переменной к метке класса. Возвращаясь к вашему вопросу, чем больше диапазон, тем сильнее влияние в целом, поэтому в этом смысле их можно сравнивать.

У меня нет опыта работы с Максентом.


Скажем, модель для классификации 2 классов, как определить, какой класс является положительным классом, а какой отрицательным?
Кумар Вайбхав,

Это хороший вопрос, вам придется поэкспериментировать и посмотреть. Документация говорит на странице 17 здесь, что если yэто фактор, то предполагается, что это проблема классификации. Однако он не говорит, какой фактор будет отображаться в положительном или отрицательном классе. Я хотел бы надеяться, что 1 или true сопоставлены с положительным классом, а 0, -1 или false сопоставлены с отрицательным классом, но я бы не принял это как должное в R.
Крис А.

в which.classаргументе есть аргумент, partialPlotи по умолчанию используется первый уровень фактора y. Таким образом, если первый уровень yявляется отрицательным случаем, то partialPlotбудет предсказывать отрицательные случаи, которые могут не соответствовать ожиданиям.
Кохелет
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.