Интерпретация трех форм «смешанной модели»

Есть различие, которое сбивает меня с толку смешанными моделями, и мне интересно, смогу ли я получить некоторую ясность в этом. Предположим, у вас смешанная модель данных подсчета. Есть переменная с фиксированным эффектом (A) и другая переменная времени (T), сгруппированные, скажем, в переменную «Site».

Как я понимаю:

glmer(counts ~ A + T, data=data, family="Poisson") модель с фиксированными эффектами

glmer(counts ~ (A + T | Site), data=data, family="Poisson") модель со случайным эффектом

Мой вопрос, когда у вас есть что-то вроде:

glmer(counts ~ A + T + (T | Site), data=data, family="Poisson")что такое Т? Это случайный эффект? Фиксированный эффект? Что на самом деле достигается путем размещения Т в обоих местах?

Когда что-то должно появляться только в разделе случайных эффектов формулы модели?

r mixed-model lme4-nlme

— фомиты
источник

Ответы:

Это может стать более понятным, если выписать формулу модели для каждой из этих трех моделей. Пусть будет наблюдением для человека на сайте в каждой модели и определим аналогично для ссылки на переменные в вашей модели. $Y_{ij}$ $i$ $j$ $A_{ij}, T_{ij}$

glmer(counts ~ A + T, data=data, family="Poisson") это модель

\log (E (Y_{i j})) = β_{0} + β_{1} A_{i j} + β_{2} T_{i j}

$\log \big( E(Y_{ij}) \big) = \beta_0 + \beta_1 A_{ij} + \beta_2 T_{ij}$

которая является обычной моделью пуассоновской регрессии.

glmer(counts ~ (A + T|Site), data=data, family="Poisson") это модель

\log (E (Y_{i j})) = α_{0} + η_{j 0} + η_{j 1} A_{i j} + η_{j 2} T_{i j}

$\log \big( E(Y_{ij}) \big) = \alpha_0 + \eta_{j0} + \eta_{j1} A_{ij} + \eta_{j2} T_{ij}$

где - это случайные эффекты, которые разделяются каждым наблюдением, сделанным людьми с сайта , Этим случайным эффектам разрешено свободно коррелировать (т. Е. На не накладываются никакие ограничения ) в указанной вами модели. Чтобы навязать независимость, вы должны поместить их в разные скобки, например , сделайте это. Эта модель предполагает, что равен для всех сайтов, но каждый сайт имеет случайное смещение ( ) и имеет случайную линейную связь с обоими . $\eta_{j} = (\eta_{j0}, \eta_{j1}, \eta_{j2}) \sim N(0, \Sigma)$ $j$ $\Sigma$ (A-1|Site) + (T-1|Site) + (1|Site) $\log \big( E(Y_{ij}) \big)$ $\alpha_0$ $\eta_{j0}$ $A_{ij}, T_{ij}$

glmer(counts ~ A + T + (T|Site), data=data, family="Poisson") это модель

\log (E (Y_{i j})) = (θ_{0} + γ_{j 0}) + θ_{1} A_{i j} + (θ_{2} + γ_{j 1}) T_{i j}

$\log \big( E(Y_{ij}) \big) = (\theta_0 + \gamma_{j0}) + \theta_1 A_{ij} + (\theta_2 + \gamma_{j1}) T_{ij}$

Так что теперь имеет некоторые «средние» отношения с , заданные фиксированными эффектами но эти отношения отличается для каждого сайта, и эти различия фиксируются случайными эффектами, . Таким образом, базовая линия смещена случайным образом, а наклоны двух переменных смещены случайным образом, и все с одного и того же сайта имеют одинаковое случайное смещение. $\log \big( E(Y_{ij}) \big)$ $A_{ij}, T_{ij}$ $\theta_0, \theta_1, \theta_2$ $\gamma_{j0}, \gamma_{j1}, \gamma_{j2}$

что такое Т? Это случайный эффект? Фиксированный эффект? Что на самом деле достигается путем размещения Т в обоих местах?

$T$ является одним из ваших ковариат. Это не случайный эффект - Siteэто случайный эффект. Существует фиксированный эффект который отличается в зависимости от случайного эффекта, предоставляемого параметром - в приведенной выше модели. То, что достигается путем включения этого случайного эффекта, состоит в том, чтобы учесть неоднородность между сайтами в отношениях между и . $T$ Site $\gamma_{j1}$ $T$ $\log \big( E(Y_{ij}) \big)$

Когда что-то должно появляться только в разделе случайных эффектов формулы модели?

Это вопрос того, что имеет смысл в контексте приложения.

Что касается перехвата - вы должны держать фиксированный перехват там по многим причинам (см., Например, здесь ); re: случайный перехват, , это в первую очередь действует, чтобы вызвать корреляцию между наблюдениями, сделанными в том же месте. Если такая корреляция не имеет смысла, случайный эффект следует исключить. $\gamma_{j0}$

Что касается случайных уклонов, модель с только случайными уклонами и без фиксированных уклонов отражает убеждение, что для каждого сайта существует некоторая связь между и вашими ковариатами для каждого сайта , но если вы усредните эти эффекты по всем сайтам, то нет никакой связи. Например, если у вас был случайный наклон в но нет фиксированного наклона, это все равно, что сказать, что время в среднем не имеет никакого эффекта (например, нет светских трендов в данных), но каждый движется со случайным направлением во времени, что может иметь смысл. Опять же, это зависит от приложения. $\log \big( E(Y_{ij}) \big)$ $T$ Site

Обратите внимание, что вы можете подобрать модель со случайными эффектами и без них, чтобы увидеть, происходит ли это - вы должны увидеть не эффект в фиксированной модели, а значительные случайные эффекты в последующей модели. Я должен предупредить вас, что подобные решения часто лучше принимать на основе понимания приложения, а не путем выбора модели.

— макрос
источник

(+1): выписывание формулы модели для каждой модели - действительно лучший способ сделать R-нотацию более прозрачной; Молодец!

— ocram

@Macro Один вопрос по уравнениям выше (спасибо им, кстати) - у них также есть обычный термин ошибки в них? Если да, то каков этот термин?

— Fomite

Привет - один из способов написать GLM - это модель для (или «связанной» версии), как я это сделал здесь. Для ожидаемого значения нет условия ошибки, если модель указана правильно. Чтобы ответить на ваш вопрос, в GLMS мы с указанием распределения по . «Остаток» случайности в линейной модели проявляется нормально распределенным членом ошибки. Но в нелинейных GLM (например, пуассоновском, логистическом) есть «встроенная» случайность, поскольку знание скорости пуассона или вероятности успеха испытания Бернулли не позволяет предсказать реализацию без ошибки. Надеюсь это поможет.

E (Y_{i j} | X)

$E(Y_{ij}|X)$

Y_{i j} | X

$Y_{ij}|X$

— Макро

Вы должны заметить, что Tэто не термины случайных эффектов, а фиксированный эффект. Случайные эффекты - это только те эффекты, которые появляются |в lmerформуле после!

Более подробное обсуждение того, что делает эта спецификация, вы можете найти в этом вопросе lmer faq .

Из этих вопросов ваша модель должна дать следующее (для вашего фиксированного эффекта T):

Глобальный уклон
Термин случайный уклон, указывающий отклонение от общего уклона для каждого уровня Site
Корреляция между случайными наклонами.

И, как сказал @ mark999, это действительно общая спецификация. В схемах с повторными измерениями вы обычно хотите иметь случайные уклоны и корреляции для всех факторов повторных измерений (внутри субъектов).

См. Следующую статью для некоторых примеров (которые я обычно привожу здесь):

Джадд, CM, Westfall, J. & Kenny, DA (2012). Рассмотрение стимулов как случайного фактора в социальной психологии: новое и всеобъемлющее решение широко распространенной, но в значительной степени игнорируемой проблемы. Журнал личности и социальной психологии , 103 (1), 54–69. DOI: 10,1037 / a0028347

— Хенрик
источник

Аналогичная ссылка из экологии: Шильцет, Хольгер и Вольфганг Форстмайер. 2009. «Выводы, выходящие за рамки поддержки: чрезмерно уверенные оценки в смешанных моделях». Поведенческая экология 20 (2) (1 марта): 416–420. DOI: 10.1093 / beheco / arn145. beheco.oxfordjournals.org/content/20/2/416 .

— Бен Болкер

Что-то должно появляться только в случайной части, когда вы не особо заинтересованы в его параметре как таковом, но должны включать его, чтобы избежать зависимых данных. Например, если дети вложены в классы, вы обычно хотите, чтобы дети были случайным эффектом.

— Питер Флом - Восстановить Монику
источник

Возможно, я вас неправильно понимаю, но я бы подумал, что фиксированные и случайные эффекты для одной и той же переменной встречаются чаще, чем переменные, имеющие только случайный эффект. Наличие фиксированных и случайных эффектов для одной и той же переменной не редкость в книге Пиньейру и Бейтса.

— mark999

@MichaelChernick, насколько я понимаю, если у вас есть фиксированный эффект и случайный эффект для одной и той же переменной, то фиксированный эффект - это общий эффект в популяции, в то время как случайный эффект позволяет по-разному влиять на переменную для каждого субъекта. Есть несколько примеров в Pinheiro & Bates.

— mark999

@PeterFlom, re: «если дети вложены в классы, вы обычно хотите, чтобы дети были случайным эффектом». Я думаю, вы имеете в виду, что класс - это случайный эффект. Если в данных нет дальнейшего вложения (например, повторные измерения на детях), то случайные эффекты на уровне детей не идентифицируются.

— Макро

@Macro Да, это то, что я имел в виду, извините. Терминология становится очень запутанной! Возможно, именно поэтому Гельман избегает терминов «фиксированный» и «случайный»

— Питер Флом - Восстановить Монику

@ Майкл, я согласен с тобой. В иерархических моделях такого типа случайные эффекты определяются группирующей переменной (в отличие от других многомерных моделей, таких как пространственно индексируемые наборы данных, где переменная «группировка» постоянно меняется). В вопросе OP, Siteбудет упоминаться как случайный эффект, а не Tили Aили что-либо еще. Думая об этом таким образом, Siteэффект явно не может быть как фиксированным, так и случайным, поскольку эти два не будут отождествляться друг с другом. Вы можете иметь фиксированные и случайные коэффициенты для переменной, но это другой вопрос.

— Макро