Я пытаюсь смоделировать данные подсчета в R, которые, по-видимому, недостаточно распределены (параметр дисперсии ~ .40). Вероятно, поэтому модель glm
с family = poisson
или отрицательной биномиальной ( glm.nb
) не имеет значения. Когда я смотрю на описания моих данных, у меня нет типичной асимметрии данных подсчета, и остатки в моих двух экспериментальных условиях также являются однородными.
Итак, мои вопросы:
Должен ли я даже использовать специальный регрессионный анализ для своих данных подсчета, если мои данные подсчета не ведут себя как данные подсчета? Иногда я сталкиваюсь с ненормальностью (обычно из-за куртоза), но я использовал метод начального процентиля для сравнения усеченных средних значений (Wilcox, 2012), чтобы учесть ненормальность. Можно ли заменить методы подсчета данных каким-либо надежным методом, предложенным Wilcox и реализованным в пакете WRS?
Если я должен использовать регрессионный анализ для подсчета данных, как я могу объяснить недостаточную дисперсию? Пуассон и отрицательное биномиальное распределение предполагают более высокую дисперсию, так что это не должно быть уместно, верно? Я думал о применении квазипуассоновского распределения, но это обычно рекомендуется для чрезмерной дисперсии. Я читал о бета-биномиальных моделях, которые, по-видимому, способны объяснить как избыточную, так и недостаточную дисперсию, доступны в
VGAM
пакете R. Однако авторы, похоже, рекомендуют наклонный дистрибутив Пуассона , но я не могу найти его в пакете. ,
Может кто-нибудь порекомендовать процедуру для недостаточно распределенных данных и, возможно, предоставить пример кода R для этого?