Когда использовать обобщенные оценочные уравнения и модели со смешанными эффектами?


63

Я довольно долго использовал модели смешанных эффектов с продольными данными. Хотелось бы, чтобы я соответствовал отношениям AR в lmer (думаю, я прав, что не могу этого сделать?), Но я не думаю, что это отчаянно важно, поэтому я не слишком беспокоюсь.

Я только что натолкнулся на обобщенные оценочные уравнения (GEE), и они, кажется, предлагают гораздо большую гибкость, чем модели ME.

Есть риск задать более общий вопрос, есть ли какой-нибудь совет относительно того, что лучше для разных задач? Я видел несколько работ, сравнивающих их, и они, как правило, имеют вид:

«В этой узкоспециализированной области не используйте GEE для X, не используйте модели ME для Y».

Я не нашел более общего совета. Кто-нибудь может просветить меня?

Спасибо!


1
«они, кажется, предлагают гораздо большую гибкость» ... Ну, они также различаются по своему подходу, поскольку GEE используются для соответствия предельному распределению, в отличие от условного подхода, часто представляющего интерес при использовании GLMM.
ЧЛ


Обратите внимание, что glmmPQLтакже могут подходить корреляционные структуры AR
Том Wenseleers

Что такое отношения AR?
Изучение статистики на примере

@incodeveritas Авторегрессионная ковариационная структура
Tommyixi

Ответы:


56

Используйте GEE, когда вы заинтересованы в раскрытии среднего для населения эффекта ковариаты по сравнению с индивидуальным специфическим эффектом. Эти две вещи эквивалентны только в линейных моделях, но не в нелинейных (например, логистических). Чтобы увидеть это, возьмите, например, логистическую модель случайных эффектов -го наблюдения -го субъекта, ;jiYij

log(pij1pij)=μ+ηi

где - случайный эффект для субъекта а .ηiN(0,σ2)ipij=P(Yij=1|ηi)

Если бы вы использовали модель случайных эффектов для этих данных, то вы бы получили оценку которая учитывает тот факт, что среднее ноль нормально распределенного возмущения было применено к каждому индивидууму, что делает его индивидуальным для каждого конкретного человека.μ

Если бы вы использовали GEE на этих данных, вы бы оценили средние шансы населения. В этом случае это будет

ν=log(Eη(11+eμηi)1Eη(11+eμηi))

νμ , в общем. Например, если и , то . Хотя случайные эффекты имеют средний ноль в преобразованной (или связанной ) шкале, их эффект не означает ноль в исходной шкале данных. Попробуйте смоделировать некоторые данные из модели логистической регрессии со смешанными эффектами и сравнить среднее значение уровня популяции с обратным логитом пересечения, и вы увидите, что они не равны, как в этом примере. Эта разница в интерпретации коэффициентов является принципиальной разницей между GEE и моделями случайных эффектов .μ=1σ2=1ν.83

Редактировать: в общем, модель смешанных эффектов без предикторов может быть записана как

ψ(E(Yij|ηi))=μ+ηi

где - это функция связи. Когда бы ниψ

ψ(Eη(ψ1(E(Yij|ηi))))Eη(E(Yij|ηi))

будет разница между средними коэффициентами населения (GEE) и индивидуальными конкретными коэффициентами (модели случайных эффектов). То есть средние значения изменяются путем преобразования данных, интегрирования случайных эффектов в преобразованном масштабе, а затем преобразования обратно. Обратите внимание, что в линейной модели (то есть ) равенство действительно выполняется, поэтому они эквивалентны.ψ(x)=x

Редактировать 2: Стоит также отметить, что «надежные» стандартные ошибки типа сэндвича, создаваемые моделью GEE, обеспечивают действительные асимптотические доверительные интервалы (например, они фактически покрывают 95% времени), даже если структура корреляции, указанная в модели, не верный.

Изменить 3: Если вы заинтересованы в понимании структуры ассоциаций в данных, оценки ассоциаций GEE общеизвестно неэффективны (а иногда и противоречивы). Я видел ссылку на это, но не могу разместить ее прямо сейчас.


3
(+1) Что касается вашего 2-го редактирования, я бы добавил, что основанные на модели оценки дисперсии будут лучше работать с небольшим количеством кластеров (или мы можем использовать оценку Джекнифа). Что касается ссылки, я всегда указываю на gbi.agrsci.dk/statistics/courses/phd07/material/Day10 , который содержит очень хорошие заметки к лекциям (стат. Фон, включая сравнение подходов GEE и GLMM + иллюстрации в R) ,
хл

Вау, какой отличный ответ. Большое спасибо. Это именно то, что я искал. И спасибо chl тоже за ссылку. +10 интернетов вам обоим.
Крис Били

Разве Джи не предполагает, что эффекты более высокого уровня являются неприятными параметрами? Мне кажется, это еще одно важное различие - если кто-то заинтересован в этих эффектах, то GEE не даст его вам. В качестве альтернативы, если вам неудобно делать такие предположения о распределении, тогда, возможно, GEE предпочтительнее.
robin.datadrivers

Ссылка, предоставленная @chl, мертва: / (шесть лет спустя вроде как ожидается, верно?)
Гильерме Март

@GuilhermeMarthe Хороший улов! К сожалению, я ссылался на этот же материал в другой ветке . Я вижу два варианта: ссылаться на пакет geepack R (разработанный теми же двумя авторами) или пока использовать WayBack Machine .
ЧЛ

10

GEE, на мой взгляд, наиболее полезен, когда мы не используем байесовское моделирование и когда полное правдоподобное решение недоступно. Кроме того, GEE может требовать больших размеров выборки, чтобы быть достаточно точными, и это очень ненадежно, чтобы не случайно пропустить продольные данные. GEE предполагает, что пропущено полностью случайно, в то время как методы правдоподобия (например, модели со смешанным эффектом или обобщенные наименьшие квадраты) предполагают, что пропущены только случайно.


1

Вы можете найти подробное обсуждение и конкретные примеры в Fitzmaurice, Laird and Ware, Прикладной продольный анализ , John Wiley & Sons, 2011, 2-е издание, главы 11-16.

Что касается примеров, вы можете найти наборы данных и программы SAS / Stata / R на сопутствующем веб-сайте .


2
Не могли бы вы обобщить основные моменты этой книги?
ЧЛ

2
Я бы сказал, что Macro уже сделал это ;-) В книге вы можете найти более длинное и подробное обсуждение, некоторые аналитические, числовые и графические примеры, а также некоторые дополнительные моменты, среди которых то, что добавил Фрэнк Харрелл. Вы также можете посмотреть блог Гельмана .
Серхио
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.