Используйте GEE, когда вы заинтересованы в раскрытии среднего для населения эффекта ковариаты по сравнению с индивидуальным специфическим эффектом. Эти две вещи эквивалентны только в линейных моделях, но не в нелинейных (например, логистических). Чтобы увидеть это, возьмите, например, логистическую модель случайных эффектов -го наблюдения -го субъекта, ;jiYij
log(pij1−pij)=μ+ηi
где - случайный эффект для субъекта а .ηi∼N(0,σ2)ipij=P(Yij=1|ηi)
Если бы вы использовали модель случайных эффектов для этих данных, то вы бы получили оценку которая учитывает тот факт, что среднее ноль нормально распределенного возмущения было применено к каждому индивидууму, что делает его индивидуальным для каждого конкретного человека.μ
Если бы вы использовали GEE на этих данных, вы бы оценили средние шансы населения. В этом случае это будет
ν=log⎛⎝⎜Eη(11+e−μ−ηi)1−Eη(11+e−μ−ηi)⎞⎠⎟
ν≠μ , в общем. Например, если и , то . Хотя случайные эффекты имеют средний ноль в преобразованной (или связанной ) шкале, их эффект не означает ноль в исходной шкале данных. Попробуйте смоделировать некоторые данные из модели логистической регрессии со смешанными эффектами и сравнить среднее значение уровня популяции с обратным логитом пересечения, и вы увидите, что они не равны, как в этом примере. Эта разница в интерпретации коэффициентов является принципиальной разницей между GEE и моделями случайных эффектов .μ=1σ2=1ν≈.83
Редактировать: в общем, модель смешанных эффектов без предикторов может быть записана как
ψ(E(Yij|ηi))=μ+ηi
где - это функция связи. Когда бы ниψ
ψ(Eη(ψ−1(E(Yij|ηi))))≠Eη(E(Yij|ηi))
будет разница между средними коэффициентами населения (GEE) и индивидуальными конкретными коэффициентами (модели случайных эффектов). То есть средние значения изменяются путем преобразования данных, интегрирования случайных эффектов в преобразованном масштабе, а затем преобразования обратно. Обратите внимание, что в линейной модели (то есть ) равенство действительно выполняется, поэтому они эквивалентны.ψ(x)=x
Редактировать 2: Стоит также отметить, что «надежные» стандартные ошибки типа сэндвича, создаваемые моделью GEE, обеспечивают действительные асимптотические доверительные интервалы (например, они фактически покрывают 95% времени), даже если структура корреляции, указанная в модели, не верный.
Изменить 3: Если вы заинтересованы в понимании структуры ассоциаций в данных, оценки ассоциаций GEE общеизвестно неэффективны (а иногда и противоречивы). Я видел ссылку на это, но не могу разместить ее прямо сейчас.