Я провожу логистическую регрессию с бинарным исходом (старт и не старт). Все мои предикторы - это либо непрерывные, либо дихотомические переменные.
Используя подход Бокса-Тидвелла, один из моих непрерывных предикторов потенциально нарушает предположение о линейности логита. В статистике соответствия качества нет никаких признаков того, что подбор проблематичен.
Впоследствии я снова запустил регрессионную модель, заменив исходную непрерывную переменную: во-первых, преобразованием квадратного корня и, во-вторых, дихотомической версией переменной.
При проверке выходных данных кажется, что качество соответствия незначительно улучшается, но остатки становятся проблематичными. Оценки параметров, стандартные ошибки и остаются относительно похожими. Интерпретация данных не меняется с точки зрения моей гипотезы, по 3 моделям.
Поэтому, с точки зрения полезности моих результатов и смысла интерпретации данных, представляется целесообразным сообщить регрессионную модель с использованием исходной непрерывной переменной.
Мне интересно это:
- Когда логистическая регрессия устойчива к потенциальному нарушению линейности логитного предположения?
- Учитывая приведенный выше пример, кажется ли приемлемым включение исходной непрерывной переменной в модель?
- Существуют ли какие-либо ссылки или руководства для того, чтобы рекомендовать, когда удовлетворительно признать, что модель устойчива к потенциальному нарушению линейности логита?