Для анализа числа птиц с нулевым уровнем инфляции я хотел бы применить модели с нулевым уровнем инфляции с использованием пакета R pscl . Однако, взглянув на приведенный в документации пример для одной из основных функций ( ? Zeroinfl ), я начинаю сомневаться в том, каково реальное преимущество этих моделей. Согласно приведенному там образцу кода, я рассчитал стандартные модели Пуассона, квази-Пуассона и отрицательного бионома, простые модели с нулевым инфляцией Пуассона и отрицательного бинома и модели с нулевым инфляцией Пуассона и отрицательного бинома с регрессорами для нулевой компоненты. Затем я проверил гистограммы наблюдаемых и подобранных данных. (Вот код для воспроизведения этого.)
library(pscl)
data("bioChemists", package = "pscl")
## standard count data models
fm_pois <- glm(art ~ ., data = bioChemists, family = poisson)
fm_qpois <- glm(art ~ ., data = bioChemists, family = quasipoisson)
fm_nb <- glm.nb(art ~ ., data = bioChemists)
## with simple inflation (no regressors for zero component)
fm_zip <- zeroinfl(art ~ . | 1, data = bioChemists)
fm_zinb <- zeroinfl(art ~ . | 1, data = bioChemists, dist = "negbin")
## inflation with regressors
fm_zip2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd +
ment, data = bioChemists)
fm_zinb2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd +
ment, data = bioChemists, dist = "negbin")
## histograms
breaks <- seq(-0.5,20.5,1)
par(mfrow=c(4,2))
hist(bioChemists$art, breaks=breaks)
hist(fitted(fm_pois), breaks=breaks)
hist(fitted(fm_qpois), breaks=breaks)
hist(fitted(fm_nb), breaks=breaks)
hist(fitted(fm_zip), breaks=breaks)
hist(fitted(fm_zinb), breaks=breaks)
hist(fitted(fm_zip2), breaks=breaks)
hist(fitted(fm_zinb2), breaks=breaks)!
Я не вижу какой-либо принципиальной разницы между различными моделями (кроме того, что данные примера не кажутся мне очень «раздутыми» ...); фактически ни одна из моделей не дает достаточно разумной оценки числа нулей. Может кто-нибудь объяснить, в чем преимущество моделей с нулевой раздувкой? Я предполагаю, что должна была быть причина, чтобы выбрать это как пример для функции.