Интерпретация логрансформированных предикторов в логистической регрессии


15

Один из предикторов в моей логистической модели был преобразован в лог. Как вы интерпретируете оценочный коэффициент логарифмического предиктора и как рассчитываете влияние этого предиктора на отношение шансов?



1
Очень четкое и всестороннее рассмотрение этого вопроса - ответ Джтезел
rolando2

Спасибо за вашу помощь. Дальнейшее уточнение. На самом деле, если я преобразую в лог-базу 2 - тогда, как и в предыдущем ответе, интуитивно понятно, что удвоение предиктора приводит к изменению на 10% в результате.
mp77

Ответы:


16

Если вы возведете в степень предполагаемый коэффициент, вы получите коэффициент шансов, связанный с кратным увеличениемb предиктора, где - это основание логарифма, который вы использовали при лог-преобразовании предиктора.b

В этой ситуации я обычно выбираю логарифмы для основания 2, поэтому я могу интерпретировать возведенный в степень коэффициент как отношение шансов, связанных с удвоением предиктора.


3
Интересный. Я всегда использую натуральные логарифмы, потому что многие коэффициенты имеют тенденцию быть близкими к нулю, а затем могут быть интерпретированы как пропорциональные (относительные) различия. Это невозможно в любой другой базе логарифма. Я вижу некоторые преимущества в использовании других основ, но я думаю, что вам нужно уточнить ваш ответ, потому что prima facie ваша интерпретация не использует значение коэффициента вообще!
whuber

@whuber извините, что означает prima facie ? Первое лицо ??
OneStop


8

@gung совершенно правильно, но, в случае , если вы действительно решили сохранить его, вы можете интерпретировать коэффициент имеет оказывает влияние на каждом кратном на IV, а не каждое добавление в IV.

Один IV, который часто должен быть преобразован, является доходом. Если вы включите его без преобразования, то каждое (скажем) увеличение дохода на 1000 долларов будет влиять на коэффициент шансов, как указано в коэффициенте шансов. С другой стороны, если вы взяли log (10) дохода, то каждое 10-кратное увеличение дохода будет влиять на коэффициент шансов, указанный в коэффициенте шансов.

Имеет смысл сделать это ради дохода, потому что во многих случаях увеличение дохода на 1000 долларов намного больше для того, кто зарабатывает 10000 долларов в год, чем для того, кто зарабатывает 100 тысяч долларов .

Последнее замечание - хотя логистическая регрессия не делает предположений о нормальности, даже регрессия OLS не делает предположений о переменных, она делает предположения об ошибке, оцениваемой по остаточным значениям.


1
+1, хорошие очки. Я полагаю, я мог бы быть более полным. Кроме того, я отключил непреднамеренный mathjax, поставив обратную косую черту "\" непосредственно перед знаками доллара. Надеюсь, ты не против.
gung - Восстановить Монику

Что вы подразумеваете под «логистической регрессией, делающей предположение об ошибках»?

Нет, регрессия OLS делает предположения об ошибках. Это то, что я сказал.
Питер Флом - Восстановить Монику

3

Этот ответ адаптирован из «Статистической сыпи» Фреда Л. Рамси и Даниэля В. Шафера.

Если ваше модельное уравнение имеет вид:

Lограмм(п/(1-п))знак равноβ0+βLограмм(Икс)

Тогда каждый Ккратное увеличение Икс связано с изменением коэффициентов мультипликативным коэффициентом Кβ,

Например, у меня есть следующая модель присутствия пролежней, регрессированных по продолжительности пребывания в больнице.

log(oddsofbedsore)=.44+0.45(lengthofstay)

So my β=0.45.

You can choose any k, based on what's works best for your model's interpretability.

I decide that k=2 and get the following:

kβ=20.45=1.37

Each doubling (k=2) of the length of stay is associated with a change in the odds of getting a bedsore by a factor of 1.37. Or if you double my length of stay, my odds of getting a bedsore will be 137% what they would have been otherwise.

Or if you decide k=0.5.

kβ=0.50.45=0.73

Each halving (k=0.5) of the length of stay is associated with a change in the odds of getting a bedsore by a factor of .73. Or if you cut my length of stay in half, my odds of getting a bedsore will only 73% of what they would have been otherwise.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.