Разница между обобщенными линейными моделями и обобщенными линейными смешанными моделями


34

Мне интересно, в чем различия между смешанными и несмешанными GLM. Например, в SPSS раскрывающееся меню позволяет пользователям выбрать:

  • analyze-> generalized linear models-> generalized linear models &
  • analyze-> mixed models-> generalized linear

Они имеют дело с отсутствующими значениями по-другому?

Моя зависимая переменная является двоичной, и у меня есть несколько категориальных и непрерывных независимых переменных.


Ответы:


62

Появление обобщенных линейных моделей позволило нам построить модели данных регрессионного типа, когда распределение переменной отклика ненормально - например, когда ваш DV двоичный. (Если вы хотели бы знать немного больше о ГЛИМСЕ, я написал довольно обширный ответ здесь , что может быть полезным , хотя контекстным различено.) Тем не менее, Глит, например, модель логистической регрессии, предполагает , что ваши данные являются независимыми . Например, представьте исследование, в котором рассматривается вопрос, развился ли у ребенка астма. Каждый ребенок вносит одинданные указывают на исследование - у них либо астма, либо нет. Иногда данные не являются независимыми, хотя. Рассмотрим другое исследование, в котором рассматривается, простужается ли ребенок в разные моменты учебного года. В этом случае каждый ребенок вносит много данных. Когда-то у ребенка может быть простуда, позже - нет, а еще позже - простуда. Эти данные не являются независимыми, потому что они получены от одного и того же ребенка. Чтобы должным образом проанализировать эти данные, нам нужно как-то принять во внимание эту независимость. Есть два способа: один из них - использовать обобщенные оценочные уравнения (о которых вы не упоминаете, поэтому мы пропустим). Другой способ - использовать обобщенную линейную смешанную модель., GLiMM могут учитывать не-независимость, добавляя случайные эффекты (как отмечает @MichaelChernick). Таким образом, ответ заключается в том, что ваш второй вариант предназначен для ненормальных данных с повторными измерениями (или, в противном случае, независимо). (Я должен упомянуть, в соответствии с комментариями @ макросов, что общ- роскопию линейные смешанные модели включают в себя линейные модели , как частный случай , и , таким образом , может использоваться с нормально распределенными данными. Однако, в типичном использовании термин ассоциируется Негауссовские данные.)

Обновление: (ФП также спросил о GEE, поэтому я напишу немного о том, как все три связаны друг с другом.)

Вот основной обзор:

  • типичный GLiM (в качестве прототипа я буду использовать логистическую регрессию) позволяет моделировать независимый двоичный ответ как функцию от ковариат
  • GLMM позволяет моделировать независимый (или кластеризованный) двоичный ответ, зависящий от атрибутов каждого отдельного кластера, как функцию от ковариат
  • ГЭЭ позволяет моделировать математическое ожидание ответа от не-независимых двоичных данных в зависимости от ковариата

Поскольку у вас есть несколько испытаний на участника, ваши данные не являются независимыми; как вы правильно заметили, «[t] риалы внутри одного участника, вероятно, будут более похожими, чем по сравнению со всей группой». Поэтому вы должны использовать либо GLMM, либо GEE.

Вопрос в том, как выбрать, подходит ли GLMM или GEE для вашей ситуации. Ответ на этот вопрос зависит от предмета вашего исследования - в частности, от цели, на которую вы надеетесь сделать выводы. Как я уже говорил выше, с GLMM бета-версии говорят вам о влиянии изменения одной единицы в ваших ковариатах на конкретного участника, учитывая его индивидуальные характеристики. С другой стороны, в GEE бета-версии говорят вам о влиянии изменения одной единицы в ваших ковариатах в среднем на ответы всей популяции, о которых идет речь. Это сложное для понимания различие, особенно из-за того, что такого различия нет в линейных моделях (в этом случае это одно и то же).

Один из способов попытаться обдумать это - представить себе усреднение по вашему населению по обе стороны от знака равенства в вашей модели. Например, это может быть модель:

logit(pi)=β0+β1X1+bi
где: Существует параметр, который управляет распределением ответа (p, вероятность, с двоичными данными) на левой стороне для каждого участника. С правой стороны, есть коэффициенты для эффекта ковариации [s] и базового уровня, когда ковариата [s] равна 0. Первое, что нужно отметить, это то, что фактический перехват для любого конкретного человеканеявляетсяβbi's (случайный эффект) обычно распределяются со средним значением 0 (как мы сделали), конечно, мы можем усреднить по ним без затруднений (это было бы просто
logit(p)=ln(p1p),     &      bN(0,σb2)
p , а точнее ( β 0 + b i ) . Ну и что? Если мы предполагаем, чтоβ0(β0+bi)bi ). Кроме того, в этом случае мы не имеем соответствующий случайный эффект для склонов иследовательноих среднее значение только β 1 . Таким образом, среднее значение пересечений плюс среднее значение уклонов должно быть равно логитному преобразованию среднего значения p i слева, не так ли? К сожалению,нет. Проблема в том, что между этими двумя находится логит , который являетсянелинейнымβ0β1pilogitпреобразование. (Если бы преобразование было линейным, оно было бы эквивалентным, поэтому эта проблема не возникает для линейных моделей.) Следующий график проясняет это: enter image description here
представьте, что этот график представляет базовый процесс создания данных для вероятности того, что небольшой класс Студенты смогут пройти тест по какому-либо предмету с заданным количеством часов обучения по этой теме. Каждая из серых кривых представляет вероятность прохождения теста с различным количеством инструкций для одного из студентов. Жирная кривая - это среднее значение по всему классу. В этом случае эффект дополнительного часа обучения условно атрибуты студента является β1- то же самое для каждого студента (то есть нет случайного наклона). Тем не менее, обратите внимание, что базовые способности учащихся различаются среди них - вероятно, из-за различий в таких вещах, как IQ (то есть, случайный перехват). Средняя вероятность для класса в целом, однако, следует за другим профилем, чем у студентов. Поразительно противоречивый результат заключается в следующем: дополнительный час обучения может оказать существенное влияние на вероятность прохождения теста каждым учеником, но сравнительно мало повлиять на вероятную общую долю сдавших учащихся . Это связано с тем, что у некоторых студентов уже был большой шанс сдать, а у других все еще мало шансов.

Вопрос о том, следует ли вам использовать GLMM или GEE, заключается в том, какую из этих функций вы хотите оценить. Если вы хотите узнать о вероятности прохождения данного студента (например, если вы были студентом или его родителем), вы хотите использовать GLMM. С другой стороны, если вы хотите знать о влиянии на население (если, например, вы были учителем или директором), вам следует использовать GEE.

Для другого, более математически подробного, обсуждения этого материала, см. Этот ответ @Macro.


2
Это хороший ответ, но я думаю, что, особенно последнее предложение, почти указывает на то, что вы используете GLM или GLMM только для ненормальных данных, которые, вероятно, не были предназначены, поскольку обычные гауссовские линейные (смешанные) модели также подпадают под категория GL (M) M
Макро

@ Макро, ты прав, я всегда об этом забываю. Я отредактировал ответ, чтобы уточнить это. Дайте мне знать, если вы думаете, что нужно больше.
gung - Восстановить Монику

Я также проверил обобщенные оценочные уравнения. Верно ли, что, как и в случае с GLiM, GEE предполагает, что мои данные независимы? У меня есть несколько испытаний на участника. Испытания в рамках одного участника, вероятно, будут более похожими, чем в целом по группе.
user9203

@ gung, Хотя GEE может производить «усредненные по населению» коэффициенты, если бы я хотел оценить средний эффект лечения (ATE) по шкале вероятности по фактической популяции, для интересующего нас двоичного регрессора, мне не нужно было бы брать предметно-ориентированный подход? Насколько мне известно, способ расчета ATE состоит в том, чтобы оценить прогнозируемую вероятность для каждого человека с лечением и без него, а затем усреднить эти различия. Разве для этого не требуется метод регрессии, который может генерировать предсказанные вероятности для каждого человека (несмотря на то, что они затем усредняются)?
Якканомица

1
@Yakkanomica, if that's what you want, sure.
gung - Reinstate Monica

6

The key is the introduction of random effects. Gung's link mentions it. But I think it should have been mentioned directly. That is the main difference.


+1, you're right. I should have been clearer about that. I edited my answer to include this point.
gung - Reinstate Monica

Whenever I add a random effect, such as a random intercept to the model, I get an error message. I think I don't have enough data-points to add random effects. Could that be the case? error message: glmm: The final Hessian matrix is not positive definite although all convergence criteria are satisfied. The procedure continues despite this warning. Subsequent results produced are based on the last iteration. Validity of the model fit is uncertain.
user9203

3

I suggest you also examine answers of a question I asked some time ago:

General Linear Model vs. Generalized Linear Model (with an identity link function?)


5
I do not think that really answers the question, which is about SPSS capabilities to run GLM and mixed-effect models, and how it handles missing values. Was this intended to be a comment instead? Otherwise, please clarify.
chl

Sorry, the opening post seemed to have two "questions". 1. I am wondering what.... and 2. Do they deal with missing values differently? I was trying to help with the first question.
Behacad

1
Fair enough. Without further explanation, I still think this would better fit as a comment to the OP.
chl
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.