Вы на правильном пути, но всегда смотрите документацию на программное обеспечение, которое вы используете, чтобы увидеть, какая модель действительно подходит. Предположим ситуацию с категориальной зависимой переменной с упорядоченными категориями 1 , … , g , … , k и предикторами X 1 , … , X j , … , X p .Y1,…,g,…,kX1,…,Xj,…,Xp
«В дикой природе» вы можете встретить три эквивалентных варианта написания теоретической модели пропорциональных шансов с различными значениями подразумеваемых параметров:
- logit(p(Y⩽g))=lnp(Y⩽g)p(Y>g)=β0g+β1X1+⋯+βpXp(g=1,…,k−1)
- logit(p(Y⩽g))=lnp(Y⩽g)p(Y>g)=β0g−(β1X1+⋯+βpXp)(g=1,…,k−1)
- logit(p(Y⩾g))=lnp(Y⩾g)p(Y<g)=β0g+β1X1+⋯+βpXp(g=2,…,k)
(Модели 1 и 2 имеют ограничение, согласно которому в отдельных бинарных логистических регрессиях β j не изменяется с g , а β 0 1 < … < β 0 g < … < β 0 k - 1 , модель 3 имеет такое же ограничение относительно β j и требует, чтобы β 0 2 > … > β 0 g > … > β 0 k )k−1βjgβ01<…<β0g<…<β0k−1βjβ02>…>β0g>…>β0k
- В модели 1, положительный означает , что увеличение предсказателя X J связанно с повышенным коэффициентом для нижней категории в Y .βjXjY
- Модель 1 несколько нелогична, поэтому модель 2 или 3 кажется предпочтительной в программном обеспечении. Здесь, положительная означает , что увеличение предсказателя X J связано с повышенным коэффициентом для более высокой категории в Y .βjXjY
- Модели 1 и 2 приводят к тем же оценкам для , но их оценки для β j имеют противоположные знаки.β0gβj
- Модели 2 и 3 приводят к тем же оценкам для , но их оценки для β 0 g имеют противоположные знаки.βjβ0g
Предполагая, что ваше программное обеспечение использует модель 2 или 3, вы можете сказать: «при увеличении на 1 единицу , при прочих равных условиях, прогнозируемые шансы наблюдать« Y = Хорошо »против наблюдения« Y = Нейтрально ИЛИ Плохо »с коэффициентом е β 1 = 0,607 . «и также» с увеличением на 1 единицу в X 1 , при прочих равных условиях, что предсказанные шансы наблюдения „ Y = хороший или нейтральный “ „ по сравнению с наблюдать Y = Bad “ изменение с коэффициентом е βX1Y=GoodY=Neutral OR Badeβ^1=0.607X1Y=Good OR NeutralY=Bad. "Обратите внимание, что в эмпирическом случае у нас есть только прогнозные шансы, а не фактические.eβ^1=0.607
Вот некоторые дополнительные иллюстрации для модели 1 с категориями. Во-первых, предположение о линейной модели для кумулятивных логитов с пропорциональными коэффициентами. Во-вторых, подразумеваемые вероятности наблюдения не более категории g . Вероятности следуют за логистическими функциями одинаковой формы.
k=4g
Для самих вероятностей категории изображенная модель подразумевает следующие упорядоченные функции:
PS Насколько мне известно, модель 2 используется в SPSS, а также в R-функциях MASS::polr()
и ordinal::clm()
. Модель 3 используется в R функциях rms::lrm()
и VGAM::vglm()
. К сожалению, я не знаю о SAS и Stata.