Вопросы с тегом «overdispersion»

Чрезмерная дисперсия - это когда существует большая изменчивость, чем «должно» быть в данных. Например, дисперсия подсчетов часто больше среднего, тогда как дисперсия Пуассона должна равняться среднему.

4
Существует ли тест для определения значимости избыточной дисперсии GLM?
Я создаю пуассоновские GLM в R. Чтобы проверить избыточную дисперсию, я смотрю на отношение остаточного отклонения к степеням свободы, предоставляемым summary(model.name). Есть ли предельное значение или критерий для того, чтобы это соотношение считалось "значительным"? Я знаю, что если это> 1, то данные перераспределены, но если у меня коэффициенты относительно близки …

4
Как мне соответствовать многоуровневой модели для перераспределенных результатов по пуассону?
Я хочу установить многоуровневый GLMM с распределением Пуассона (с избыточной дисперсией), используя R. В настоящее время я использую lme4, но я заметил, что недавно quasipoissonсемейство было удалено. В другом месте я видел, что вы можете моделировать аддитивную избыточную дисперсию для биномиальных распределений, добавляя случайный перехват с одним уровнем на наблюдение. …

2
Что такое квазибиномиальное распределение (в контексте GLM)?
Я надеюсь, что кто-то может дать интуитивный обзор того, что такое квазибиномиальное распределение и что оно делает. Меня особенно интересуют эти моменты: Чем квазибиномиал отличается от биномиального распределения. Когда переменная отклика представляет собой пропорцию (примерные значения включают 0,23, 0,11, 0,78, 0,98), квазибиномиальная модель будет работать в R, а биномиальная модель …

4
Стратегия выбора подходящей модели для подсчета данных
Какова подходящая стратегия для решения, какую модель использовать с данными подсчета? У меня есть данные подсчета, которые мне нужно моделировать как многоуровневые модели, и мне (на этом сайте) было рекомендовано, что лучший способ сделать это - через ошибки или MCMCglmm. Однако я все еще пытаюсь узнать о байесовской статистике, и …

2
Когда кто-то говорит, что для модели Пуассона остаточное отклонение / df должно составлять ~ 1, насколько приблизительным является приблизительное значение?
Я часто видел советы по проверке того, является ли подход Пуассона более рассредоточенным, включая деление остаточного отклонения на степени свободы. Результирующее соотношение должно быть «примерно 1». Вопрос в том, о каком диапазоне мы говорим о «приблизительном» - каково соотношение, которое должно вызывать сигналы тревоги для рассмотрения альтернативных форм моделей?

2
Пуассон или квази пуассон в регрессии с данными подсчета и избыточной дисперсией?
У меня есть данные подсчета (анализ спроса / предложения с подсчетом количества клиентов, в зависимости от - возможно - многих факторов). Я пробовал линейную регрессию с нормальными ошибками, но мой QQ-график не очень хорош. Я попробовал лог-преобразование ответа: еще раз плохой QQ-сюжет. Итак, сейчас я пытаюсь регрессии с пуассоновскими ошибками. …

2
Являются ли тесты на избыточную дисперсию в GLM действительно * полезными *?
Феномен «чрезмерной дисперсии» в GLM возникает всякий раз, когда мы используем модель, которая ограничивает дисперсию переменной отклика, и данные демонстрируют большую дисперсию, чем позволяет ограничение модели. Это обычно происходит при моделировании данных подсчета с использованием Poisson GLM, и это можно диагностировать с помощью хорошо известных тестов. Если тесты показывают, что …

2
Моделирование распределения Пуассона с избыточной дисперсией
У меня есть набор данных, который я ожидаю, чтобы следовать распределению Пуассона, но он разбросан примерно в 3 раза. В настоящее время я моделирую эту избыточную дисперсию, используя что-то вроде следующего кода в R. ## assuming a median value of 1500 med = 1500 rawdist = rpois(1000000,med) oDdist = rawDist …

2
Сверхдисперсия в логистической регрессии
Я пытаюсь понять концепцию чрезмерной дисперсии в логистической регрессии. Я читал, что избыточная дисперсия - это когда наблюдаемая дисперсия переменной отклика больше, чем можно было бы ожидать от биномиального распределения. Но если биномиальная переменная может иметь только два значения (1/0), как она может иметь среднее значение и дисперсию? Я в …

1
Как бороться с чрезмерной дисперсией в пуассоновской регрессии: квази-правдоподобие, отрицательный биномиальный GLM или случайный эффект на уровне субъекта?
Я натолкнулся на три предложения по поводу чрезмерной дисперсии в переменной отклика Пуассона и стартовой модели с фиксированными эффектами: Используйте квази-модель; Используйте отрицательный биномиальный GLM; Используйте смешанную модель со случайным эффектом на уровне объекта. Но какой на самом деле выбрать и почему? Есть ли какой-то фактический критерий среди них?

1
Одинаковые коэффициенты, оцениваемые в модели Пуассона и Квази-Пуассона
При моделировании данных подсчета претензий в страховой среде я начал с Пуассона, но затем заметил чрезмерную дисперсию. Квази-Пуассон лучше моделировал большее отношение средней дисперсии, чем основной Пуассон, но я заметил, что коэффициенты были идентичны как в модели Пуассона, так и в модели Квази-Пуассона. Если это не ошибка, почему это происходит? …

1
Сверхдисперсность и моделирование в пуассоновских моделях случайных эффектов со смещениями
Я столкнулся с рядом практических вопросов при моделировании данных подсчета из экспериментальных исследований с использованием эксперимента внутри объекта. Я кратко опишу эксперимент, данные и то, что я уже сделал, а затем мои вопросы. Четыре различных фильма были показаны выборке респондентов в последовательности. После каждого фильма проводилось интервью, в котором мы …

2
Как проверить избыточную дисперсию в пуассоновском GLMM с помощью lmer () в R?
У меня есть следующая модель: > model1<-lmer(aph.remain~sMFS1+sAG1+sSHDI1+sbare+season+crop +(1|landscape),family=poisson) ... и это сводный результат. > summary(model1) Generalized linear mixed model fit by the Laplace approximation Formula: aph.remain ~ sMFS1 + sAG1 + sSHDI1 + sbare + season + crop + (1 | landscape) AIC BIC logLik deviance 4057 4088 -2019 4039 …

2
Параметрическое моделирование дисперсии данных счета
Я хочу смоделировать некоторые данные, но я не уверен, какой тип модели я могу использовать. У меня есть данные подсчета, и я хочу модель, которая даст параметрические оценки как среднего значения, так и дисперсии данных. То есть у меня есть различные прогностические факторы, и я хочу определить, влияет ли какой-либо …

1
Почему Anova () и drop1 () предоставили разные ответы для GLMM?
У меня есть GLMM формы: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Когда я использую drop1(model, test="Chi"), я получаю другие результаты, чем если бы я использовал Anova(model, type="III")из пакета автомобиля или summary(model). Последние два дают одинаковые ответы. Используя кучу сфабрикованных данных, я обнаружил, …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.