дисперсия в summary.glm ()

13

Я провел glm.nb по

glm1<-glm.nb(x~factor(group))

с группой, являющейся категориальной, и х, являющейся метрической переменной. Когда я пытаюсь получить сводку результатов, я получаю немного разные результаты, в зависимости от того, использую я summary()или summary.glm. summary(glm1)дает мне

    ...
Coefficients:
                    Estimate Std. Error z value Pr(>|z|)  
    (Intercept)       0.1044     0.1519   0.687   0.4921  
    factor(gruppe)2   0.1580     0.2117   0.746   0.4555  
    factor(gruppe)3   0.3531     0.2085   1.693   0.0904 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 1)

тогда как summary.glm (glm1) дает мне

    ...
Coefficients:
                    Estimate Std. Error t value Pr(>|t|)  
    (Intercept)       0.1044     0.1481   0.705   0.4817  
    factor(gruppe)2   0.1580     0.2065   0.765   0.4447  
    factor(gruppe)3   0.3531     0.2033   1.737   0.0835 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067)

Я понимаю значение параметра дисперсии, но не линии

(Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067),

В справочнике говорится, что это будет оценочная дисперсия, но, похоже, это неверная оценка, поскольку 0,95 не близко к 0,7109 или же оценочная дисперсия чем-то отличается от расчетного параметра дисперсии? Я предполагаю, что я должен установить дисперсию в чем- summary.nb(x, dispersion=)то, но я не уверен, если я должен установить дисперсию в 1 (что даст тот же результат, summary()или если я должен вставить оценку параметра дисперсии, в этом случае приводит к summary.nb(glm1, dispersion=0.7109)или что-то еще? Или я в порядке только с использованием summary(glm1)?

r generalized-linear-model negative-binomial

— Ренуар Пулитц
источник

2

Используйте summary () при отправке в соответствующий метод S3 для класса negbin. Дисперсия, конечно, должна быть равна 1, что оценивается как тета, которую лучше назвать параметром формы, чтобы избежать путаницы. См. Также stats.stackexchange.com/questions/27773/how-does-glm-nb-work/…

— Momo

13

summary.glm"negbin"summary.glmdispersionsummary.glm glm $\phi$ $\phi$ familyglm.nb"Negative Binomial(theta)"summary.glmна модели установлено glm.nb, в коде

if (is.null(dispersion)) 
    dispersion <- if (object$family$family %in% c("poisson", 
        "binomial")) 
        1
    else if (df.r > 0) {
        est.disp <- TRUE
        if (any(object$weights == 0)) 
                warning("observations with zero weight not used for calculating dispersion")
            sum((object$weights * object$residuals^2)[object$weights > 
            0])/df.r
    }

"poisson""binomial" $\phi$ summary.negbin

$\phi$ dispersion

Во-вторых, вы неправильно понимаете вывод. Когда ты видишь

Negative Binomial(0.7109)

$\hat{\theta}$ $\phi$

$\phi$ $\phi = 1$ summary.negbin

summary(glm1, dispersion = 0.9509)

negbin $\phi$

— Восстановить Монику - Дж. Симпсон
источник

5

+1 Хорошее объяснение. У меня есть два небольших комментария: параметр дисперсии в биномиальном, пуассоновском и отрицательном биномах с известным параметром формы равен 1 по определению экспоненциального семейства (это не предположение). Когда вы говорите, что другая дисперсия может быть оценена и предоставлена для суммарного метода, тогда нужно быть осторожным, потому что вы рискуете попасть на квази-территорию, что имеет последствия, особенно для вероятности.

— Момо

@ Момо хорошо сказал. Я разрывался между тем, что вы заявляете, и деталями справочной страницы для соответствующих функций.

— Восстановить Монику - Дж. Симпсон

2

$\theta$ $\frac{1}{\theta}$ $1$ $\frac{1}{\theta}$ $E$ $Y$ $E$ $\mu E$ $\mu$

f (y) = \frac{Γ (θ + y)}{Γ (θ) y!} \cdot \frac{μ^{y} θ^{θ}}{(μ + θ)^{θ + y}}

$f(y)=\frac{\Gamma(\theta +y)}{\Gamma(\theta) y!}\cdot\frac{\mu^y \theta^\theta}{(\mu+\theta)^{\theta+y}}$

ожидание

E Y = μ

$\operatorname{E}Y=\mu$

& дисперсия

Var Y = μ + \frac{μ^{2}}{θ}

$\operatorname{Var} Y = \mu +\frac{\mu^2}{\theta}$

Как указывает @Momo, параметр дисперсии - это совсем другая вещь, которую вы бы позволили варьировать для оценки квази-правдоподобия. Для отрицательной биномиальной модели и (истинной) модели Пуассона она справедливо установлена в значение единица.

— Scortchi - Восстановить Монику
источник