Один из предикторов в моей логистической модели был преобразован в лог. Как вы интерпретируете оценочный коэффициент логарифмического предиктора и как рассчитываете влияние этого предиктора на отношение шансов?
Один из предикторов в моей логистической модели был преобразован в лог. Как вы интерпретируете оценочный коэффициент логарифмического предиктора и как рассчитываете влияние этого предиктора на отношение шансов?
Ответы:
Если вы возведете в степень предполагаемый коэффициент, вы получите коэффициент шансов, связанный с кратным увеличением предиктора, где - это основание логарифма, который вы использовали при лог-преобразовании предиктора.
В этой ситуации я обычно выбираю логарифмы для основания 2, поэтому я могу интерпретировать возведенный в степень коэффициент как отношение шансов, связанных с удвоением предиктора.
@gung совершенно правильно, но, в случае , если вы действительно решили сохранить его, вы можете интерпретировать коэффициент имеет оказывает влияние на каждом кратном на IV, а не каждое добавление в IV.
Один IV, который часто должен быть преобразован, является доходом. Если вы включите его без преобразования, то каждое (скажем) увеличение дохода на 1000 долларов будет влиять на коэффициент шансов, как указано в коэффициенте шансов. С другой стороны, если вы взяли log (10) дохода, то каждое 10-кратное увеличение дохода будет влиять на коэффициент шансов, указанный в коэффициенте шансов.
Имеет смысл сделать это ради дохода, потому что во многих случаях увеличение дохода на 1000 долларов намного больше для того, кто зарабатывает 10000 долларов в год, чем для того, кто зарабатывает 100 тысяч долларов .
Последнее замечание - хотя логистическая регрессия не делает предположений о нормальности, даже регрессия OLS не делает предположений о переменных, она делает предположения об ошибке, оцениваемой по остаточным значениям.
Этот ответ адаптирован из «Статистической сыпи» Фреда Л. Рамси и Даниэля В. Шафера.
Если ваше модельное уравнение имеет вид:
Тогда каждый кратное увеличение связано с изменением коэффициентов мультипликативным коэффициентом ,
Например, у меня есть следующая модель присутствия пролежней, регрессированных по продолжительности пребывания в больнице.
So my .
You can choose any , based on what's works best for your model's interpretability.
I decide that and get the following:
Each doubling () of the length of stay is associated with a change in the odds of getting a bedsore by a factor of 1.37. Or if you double my length of stay, my odds of getting a bedsore will be 137% what they would have been otherwise.
Or if you decide .
Each halving () of the length of stay is associated with a change in the odds of getting a bedsore by a factor of .73. Or if you cut my length of stay in half, my odds of getting a bedsore will only 73% of what they would have been otherwise.