Чтобы лучше задать мой вопрос, я предоставил некоторые из выводов как из 16 переменных моделей ( fit
), так и из 17 переменных моделей ( fit2
) ниже (все предикторные переменные в этих моделях являются непрерывными, где единственное различие между этими моделями состоит в том, fit
что содержит переменную 17 (var17)):
fit Model Likelihood Discrimination Rank Discrim.
Ratio Test Indexes Indexes
Obs 102849 LR chi2 13602.84 R2 0.173 C 0.703
0 69833 d.f. 17 g 1.150 Dxy 0.407
1 33016 Pr(> chi2) <0.0001 gr 3.160 gamma 0.416
max |deriv| 3e-05 gp 0.180 tau-a 0.177
Brier 0.190
fit2 Model Likelihood Discrimination Rank Discrim.
Ratio Test Indexes Indexes
Obs 102849 LR chi2 13639.70 R2 0.174 C 0.703
0 69833 d.f. 18 g 1.154 Dxy 0.407
1 33016 Pr(> chi2) <0.0001 gr 3.170 gamma 0.412
max |deriv| 3e-05 gp 0.180 tau-a 0.177
Brier 0.190
Я использовал rms
пакет Фрэнка Харрелла для создания этих lrm
моделей. Как вы можете видеть, эти модели, по-видимому, не сильно отличаются друг от друга в зависимости от индексов дискриминации и ранга дискриминации. Индексы ; Однако, используя lrtest(fit,fit2)
, мне были предоставлены следующие результаты:
L.R. Chisq d.f. P
3.685374e+01 1.000000e+00 1.273315e-09
Таким образом, мы отвергли бы нулевую гипотезу этого теста отношения правдоподобия; однако я предполагаю, что это, вероятно, связано с большим размером выборки ( n = 102849), поскольку эти модели работают аналогичным образом. Кроме того, мне интересно найти лучший способ формального сравнения вложенных бинарных моделей логистической регрессии, когда n велико.
Я очень ценю любые отзывы, R-сценарии или документацию, которые могут направить меня в правильном направлении с точки зрения сравнения этих типов вложенных моделей! Спасибо!
fit2
это модель с 17 переменными, но это также модель, которая опускается V17
. Вы можете редактировать это.
fit2
на fit
в приведенном выше примере в соответствии с вашей коррекцией. Спасибо!