Я столкнулся с рядом практических вопросов при моделировании данных подсчета из экспериментальных исследований с использованием эксперимента внутри объекта. Я кратко опишу эксперимент, данные и то, что я уже сделал, а затем мои вопросы.
Четыре различных фильма были показаны выборке респондентов в последовательности. После каждого фильма проводилось интервью, в котором мы подсчитывали количество появлений определенных утверждений, которые представляли интерес для RQ (прогнозируемой переменной количества). Мы также записали максимальное количество возможных вхождений (единицы кодирования; переменная смещения). Кроме того, некоторые особенности фильмов были измерены в непрерывном масштабе, для одного из которых у нас есть причинная гипотеза о влиянии функции фильма на количество утверждений, в то время как другие контролируют (предикторы).
Принятая до настоящего времени стратегия моделирования выглядит следующим образом:
Оцените случайную модель Пуассона со случайным эффектом, в которой причинная переменная используется в качестве ковариаты, а другие переменные - в качестве управляющих ковариат. Эта модель имеет смещение, равное «log (единицам)» (единицам кодирования). Случайные эффекты выполняются по субъектам (специфичные для фильма значения вложены в объекты). Мы находим причинную гипотезу подтвержденной (сиг. Коэффициент причинной переменной). Для оценки мы использовали пакет lme4 в R, в частности, функцию glmer.
Теперь у меня есть следующие вопросы. Распространенной проблемой в пуассоновской регрессии является избыточная дисперсия. Я знаю, что это можно проверить, используя отрицательную биномиальную регрессию и оценивая, улучшает ли ее параметр дисперсии соответствие модели простой модели Пуассона. Однако я не знаю, как это сделать в контексте случайных эффектов.
- Как мне проверить на избыточную дисперсию в моей ситуации? Я проверил чрезмерную дисперсию в простой регрессии Пуассона / отрицательной биномиальной модели (без случайных эффектов), которую я знаю, как соответствовать. Тест предполагает наличие чрезмерной дисперсии. Однако, поскольку эти модели не учитывают кластеризацию, я полагаю, что этот тест некорректен. Также я не уверен насчет роли смещения для испытаний на избыточную дисперсию.
- Есть ли что-то вроде регрессионной модели с отрицательным биномиальным случайным эффектом и как я должен соответствовать ей в R?
- Есть ли у вас предложения по альтернативным моделям, которые я должен примерить на данные, т.е. принять во внимание структуру повторных измерений, переменные счета и экспозицию (единицы кодирования)?