С точки зрения интерпретации коэффициентов, существует разница в двоичном случае (среди прочих). Что отличается между GEE и GLMM, так это цель вывода: средняя по населению или предметная .
YniN∑Ni=1niYij=1jiYij=0xij=1ji
Чтобы ввести терминологию, которую я использовал в первом абзаце, вы можете думать о школе как о населении, а о классных комнатах - как о предметах .
bi
log(P(Yij=1)P(Yij=0)∣xij,bi)=β0+β1xij+bi
bi
GEE, с другой стороны, соответствует маргинальной модели. Эти модели населения в среднем . Вы моделируете ожидание, условное только на вашей фиксированной матрице дизайна.
log(P(Yij=1)P(Yij=0)∣xij)=β0+β1xij
Это в отличие от моделей со смешанным эффектом, как объяснено выше, которые влияют как на матрицу с фиксированным дизайном, так и на случайные эффекты. Итак, в приведенной выше маржинальной модели вы говорите: «Забудьте о разнице между классами, я просто хочу, чтобы уровень неудач среди населения (в школах) и его связь с полом». Вы подходите к модели и получаете отношение шансов, которое является усредненным для населения отношением шансов неудачи, связанной с полом.
Таким образом, вы можете обнаружить, что ваши оценки по вашей модели GEE могут отличаться от ваших оценок по модели GLMM, и это потому, что они не оценивают одно и то же.
(Что касается преобразования логарифмического отношения шансов в отношение шансов путем возведения в степень, да, вы делаете это, будь то оценка на уровне населения или предметная оценка)
Некоторые заметки / литература:
Для линейного случая средние по населению и предметные оценки одинаковы.
Zeger et al. 1988 показал, что для логистической регрессии,
βM≈[(163√15π)2V+1]−1/2βRE
βMβREV
В Molenberghs, Verbeke 2005 есть целая глава о моделях предельных и случайных эффектов.
Я узнал об этом и связанном с ним материале в курсе, основанном на материалах Diggle, Heagerty, Liang, Zeger 2002 , отличная ссылка.