Протестируйте модель GLM, используя нулевые и модельные отклонения


11

Я построил модель glm в R и протестировал ее с помощью группы тестирования и обучения, поэтому уверен, что она работает хорошо. Результаты от R:

Coefficients:
                            Estimate Std. Error  t value Pr(>|t|)    
(Intercept)               -2.781e+00  1.677e-02 -165.789  < 2e-16 ***
Coeff_A                    1.663e-05  5.438e-06    3.059  0.00222 ** 
log(Coeff_B)               8.925e-01  1.023e-02   87.245  < 2e-16 ***
log(Coeff_C)              -3.978e-01  7.695e-03  -51.689  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for quasibinomial family taken to be 0.9995149)

    Null deviance: 256600  on 671266  degrees of freedom
Residual deviance: 237230  on 671263  degrees of freedom
AIC: NA

Все значения p для коэффициентов малы, как и ожидалось.

Глядя на этот вопрос ( Интерпретация остаточного и нулевого отклонения в GLM R ), я смогу рассчитать, справедлива ли нулевая гипотеза, используя следующее уравнение:

p-value = 1 - pchisq(deviance, degrees of freedom)

Вставляя это в дает:

1 - pchisq(256600, 671266)
[1] 1

Так что я прав, думая, что нулевая гипотеза не может быть отвергнута здесь, даже если значения p для всех коэффициентов настолько малы, или я неверно истолковал, как рассчитать это?

Ответы:


18

Здесь есть недоразумение. Разница между нулем девиантности и девиантности в модели распространяется как хи-квадрат со степенями свободы равна нулевому ФР минус ФР модели. Для вашей модели это будет:

1-pchisq(256600 - 237230, df=(671266 - 671263))
# [1] 0

pchisq()lower.tail = FALSE1


2
Какую гипотезу вы точно проверяете с утверждением 1-pchisq(256600 - 237230, df=(671266 - 671263))?
ИСИ

5
@jesterII, вы проверяете, изменилось ли отклонение больше, чем можно было ожидать случайно. То есть вы тестируете, является ли модель в целом лучше, чем нулевая модель. Это аналог глобального F-теста в линейной модели.
gung - Восстановить Монику

Нулевая гипотеза «модель в целом лучше, чем нулевая модель», и вы отвергли нулевую гипотезу, что означает, что модель плохая?
ИСИ

3
@ jesterII, нет нулевой гипотезы: «модель в целом не лучше, чем нулевая модель». Поскольку это было отклонено, мы заключаем, что данные не соответствуют нулевой модели. NB, это не обязательно означает, что наша модель «хорошая» или «правильная».
gung - Восстановить Монику
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.