Какова подходящая стратегия для решения, какую модель использовать с данными подсчета? У меня есть данные подсчета, которые мне нужно моделировать как многоуровневые модели, и мне (на этом сайте) было рекомендовано, что лучший способ сделать это - через ошибки или MCMCglmm. Однако я все еще пытаюсь узнать о байесовской статистике, и я подумал, что сначала я должен попытаться приспособить свои данные к обобщенным линейным моделям и игнорировать вложенную структуру данных (просто чтобы получить смутное представление о том, чего ожидать).
Около 70% данных равны 0, а отношение дисперсии к среднему равно 33. Таким образом, данные сильно разбросаны.
Попробовав ряд различных вариантов (включая пуассоновскую, отрицательную биномиальную, квази-и нулевую раздутую модель), я вижу очень небольшую согласованность результатов (варьирование от всего значимого до ничего значительного).
Как я могу принять обоснованное решение о том, какой тип модели выбрать на основе нулевой инфляции и чрезмерной дисперсии? Например, как я могу сделать вывод, что квази-пуассон является более подходящим, чем отрицательный бином (или наоборот), и как я могу знать, что использование одного из них адекватно (или нет) с избыточными нулями? Точно так же, как я могу оценить, что больше нет чрезмерной дисперсии, если используется модель с нулевым раздувом? или как мне выбрать между нулевым завышенным пуассоном и нулевым завышенным отрицательным биномом?