Это вопрос, касающийся практики или метода, которым следуют некоторые из моих коллег. При создании модели логистической регрессии я видел, как люди заменяли категориальные переменные (или непрерывные переменные, которые сгруппированы) на соответствующий вес доказательств (WoE). Предположительно это делается для установления монотонной связи между регрессором и зависимой переменной. Теперь, насколько я понимаю, после создания модели переменные в уравнении НЕ являются переменными в наборе данных. Скорее, переменные в уравнении теперь являются своего рода важностью или весом переменных в разделении зависимой переменной !
Мой вопрос: как мы теперь интерпретируем модель или модельные коэффициенты? Например, для следующего уравнения:
мы можем сказать, что - это относительное увеличение нечетного отношения при увеличении на 1 единицу переменной .
Но если переменная заменена на ее WoE, то интерпретация будет изменена на: относительное увеличение нечетного отношения на 1 единицу увеличения ВАЖНОСТИ / ВЕСА переменной
Я видел эту практику в интернете, но нигде не нашел ответа на этот вопрос. Эта ссылка самого сообщества связана с похожим запросом, где кто-то написал:
WoE отображает линейную зависимость с натуральным логарифмом отношения шансов, который является зависимой переменной в логистической регрессии. Поэтому вопрос о неправильной спецификации модели не возникает в логистической регрессии, когда мы используем WoE вместо фактических значений переменной.
Но я до сих пор не получил объяснения. Пожалуйста, помогите мне понять, чего мне не хватает.