Логистическая регрессия и порядковые независимые переменные


10

Я нашел этот пост:

Да. Коэффициент отражает изменение логарифмических коэффициентов для каждого приращения изменения в порядковом предикторе. Эта (очень распространенная) спецификация модели предполагает, что предиктор оказывает линейное влияние на свои приращения. Чтобы проверить предположение, вы можете сравнить модель, в которой вы используете порядковую переменную в качестве единственного предиктора, с моделью, в которой вы дискретизируете ответы и рассматриваете их как несколько предикторов (как если бы переменная была номинальной); если последняя модель не приводит к значительно лучшей подгонке, то разумно рассматривать каждый шаг как имеющий линейный эффект.

- @ dmk38 12 декабря 2010 года в 5:21

Не могли бы вы сказать мне, где можно найти что-то опубликовано в поддержку этого утверждения? Я работаю с данными, и я хотел бы использовать порядковые независимые переменные в логистической регрессии.


Смотрите аналогичный вопрос stats.stackexchange.com/q/195246/3277
ttnphns

Ответы:


2

Как отмечает @Scortchi , вы также можете использовать ортогональные полиномы. Вот быстрая демонстрация в R:

set.seed(3406)
N      = 50
real.x = runif(N, 0, 10)
ord.x  = cut(real.x, breaks=c(0,2,4,6,8,10), labels=FALSE)
ord.x  = factor(ord.x, levels=1:5, ordered=TRUE)
lo.lin = -3 + .5*real.x
p.lin  = exp(lo.lin)/(1 + exp(lo.lin))
y.lin  = rbinom(N, 1, prob=p.lin)

mod.lin = glm(y.lin~ord.x, family=binomial)
summary(mod.lin)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)   
# (Intercept)  0.05754    0.36635   0.157  0.87520   
# ord.x.L      2.94083    0.90304   3.257  0.00113 **
# ord.x.Q      0.94049    0.85724   1.097  0.27260   
# ord.x.C     -0.67049    0.77171  -0.869  0.38494   
# ord.x^4     -0.09155    0.73376  -0.125  0.90071   
# ...

8

Любая хорошая книга по логистической регрессии будет иметь это, хотя, возможно, не совсем в этих словах. Попробуйте категоричный анализ данных Agresti для очень авторитетного источника.

Это также следует из определения логистической регрессии (или других регрессий). Есть несколько методов явно для порядковых независимых переменных. Обычные варианты рассматривают его как категоричный (который теряет порядок) или как непрерывный (что делает предположение, изложенное в том, что вы цитировали). Если вы рассматриваете это как непрерывное, то программа, выполняющая анализ, не знает, что это порядковый номер. Например, предположим, что ваш IV "Насколько вам нравится президент Обама?" и ваш выбор ответа - шкала Лайкерта от 1. «Очень» до 5. «Совсем нет». Если вы считаете это непрерывным, то (с точки зрения программы) ответ «5» будет 5 раз ответом «1». Это может или не может быть необоснованным.


3
Раздел 5.4.6. И вы можете расширить идею, используя ортогональные полиномы для кодирования порядкового предиктора.
Scortchi - Восстановить Монику

Спасибо за ваши комментарии, они очень помогут в моем анализе.
Фредерико

2
@Frederico, если ответ Питера разрешил ваш вопрос, вы должны принять его, нажав на флажок под общим количеством голосов слева.
gung - Восстановить Монику
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.