Шпаргалка R's lmer


160

На этом форуме много обсуждается вопрос о том, как правильно указать различные иерархические модели lmer.

Я думал, что было бы здорово иметь всю информацию в одном месте. Пара вопросов для начала:

  1. Как указать несколько уровней, где одна группа вложена в другую: это (1|group1:group2)или нет (1+group1|group2)?
  2. В чем разница между (~1 + ....)и (1 | ...)и (0 | ...)т. Д.?
  3. Как определить взаимодействия на уровне группы?

11
В ручной и три виньетки для lme4пакета можно найти на CRAN
Генри

4
В дополнение к материалам CRAN, слайды лекций и черновые главы книги, на которой Дуг пишет (G) LMM и R с lme4, доступны из r-forge
Гэвин Симпсон

Прямая ссылка на версию JSS arXiv от Bates et al .: Подгонка линейных моделей со смешанными эффектами с использованием lme4 (в частности, раздел 2.2 «Понимание формул смешанной модели»). См. Также соответствующий раздел часто задаваемых вопросов Бена Болкера.
амеба

5
Можно утверждать, что используемый язык lmerпредставляет общий статистический интерес и, следовательно, не является исключительно вопросом программирования. Поэтому я голосую, чтобы оставить эту тему открытой.
whuber

2
@whuber +1 Полностью согласен.
амеба

Ответы:


180

В чем разница между (~ 1 + ....) и (1 | ...) и (0 | ...) и т. Д.?

Скажем, у вас есть переменная V1, предсказанная категориальной переменной V2, которая рассматривается как случайный эффект, и непрерывная переменная V3, которая рассматривается как линейный фиксированный эффект. Используя синтаксис lmer, простейшая модель (M1):

V1 ~ (1|V2) + V3

Эта модель будет оценивать:

P1: глобальный перехват

P2: Случайный эффект перехватывает для V2 (то есть для каждого уровня V2 отклонение перехвата этого уровня от глобального перехвата)

P3: единая глобальная оценка эффекта (наклона) V3

Следующая наиболее сложная модель (M2):

V1 ~ (1|V2) + V3 + (0+V3|V2)

Эта модель оценивает все параметры из M1, но дополнительно оценит:

P4: Эффект V3 в каждом уровне V2 (более конкретно, степень, в которой эффект V3 в пределах данного уровня отклоняется от общего эффекта V3), в то же время обеспечивая нулевую корреляцию между отклонениями перехвата и отклонениями эффекта V3 по уровням из V2 .

Это последнее ограничение ослаблено в последней самой сложной модели (M3):

V1 ~ (1+V3|V2) + V3

В котором оцениваются все параметры из M2, в то же время допускается корреляция между отклонениями перехвата и отклонениями эффекта V3 в пределах уровней V2. Таким образом, в M3 оценивается дополнительный параметр:

P5: корреляция между отклонениями перехвата и отклонениями V3 по уровням V2

Обычно пары моделей, такие как M2 и M3, вычисляются, а затем сравниваются для оценки доказательств корреляции между фиксированными эффектами (включая глобальный перехват).

Теперь рассмотрите возможность добавления другого предиктора с фиксированным эффектом, V4. Модель:

V1 ~ (1+V3*V4|V2) + V3*V4

оценил бы:

P1: глобальный перехват

P2: единая глобальная оценка эффекта V3

P3: единая глобальная оценка эффекта V4

P4: единая глобальная оценка взаимодействия между V3 и V4

P5: отклонения перехвата от P1 на каждом уровне V2

P6: отклонения эффекта V3 от P2 на каждом уровне V2

P7: отклонения эффекта V4 от P3 на каждом уровне V2

P8: отклонения взаимодействия V3 от V4 от P4 на каждом уровне V2

P9 Корреляция между P5 и P6 по уровням V2

P10 Корреляция между P5 и P7 по уровням V2

P11 Корреляция между P5 и P8 по уровням V2

P12 Корреляция между P6 и P7 по уровням V2

P13 Корреляция между P6 и P8 по уровням V2

P14 Корреляция между P7 и P8 по уровням V2

Фу , это много параметров! И я даже не удосужился перечислить параметры дисперсии, оцененные моделью. Более того, если у вас есть категориальная переменная с более чем 2 уровнями, которую вы хотите смоделировать как фиксированный эффект, вместо одного эффекта для этой переменной вы всегда будете оценивать k-1 эффекты (где k - количество уровней) , тем самым взорвав количество параметров, которые будут оцениваться моделью, еще дальше.


1
@ Майк Лоуренс Спасибо за ответ! Как тогда оценивается трехуровневая модель? где один группирующий фактор вложен в другой?

DBR, я не думаю, что вы знаете, что такое уровни. Вы спрашивали об этом вечно. Составьте вопрос, который фактически детализирует ваш экспериментальный дизайн и демонстрирует вашу интерпретацию «уровня».
Джон

3
Я думаю, что DBR относится к уровням в иерархии. То, что я описал, представляет собой двухуровневую иерархическую модель с наблюдениями, вложенными в предметы, и DBR задает вопрос о трехуровневых иерархиях, примером которых могут быть тестовые задания внутри учеников в школах, где вы хотите моделировать учеников и школы как случайные эффекты, с учениками, вложенными в школы. В таких случаях я предполагаю, что отклонения на уровне школы сначала рассчитываются, а не отклонения от ученика.
Майк Лоуренс

2
Лучший ответ, который я когда-либо видел для настройки моделей. Помог мне предоставить боссу простую структуру, чтобы понять, что я делаю в R с lmer.
bfoste01

Скажем, у меня есть одна независимая переменная (X) на индивидуальном уровне и одна независимая переменная (Z) на уровне группы. Оба являются непрерывной переменной. Если модель , где нижний индекс обозначает го человека, а обозначает ю группу. затем с использованием синтаксиса будет модель , где находится другая переменная во фрейме данных, чтобы указать, к какой группе принадлежит индивид? i i j j
Yij=γ00+γ10Xij+γ01Zj+γ11XijZj+u1jXij+u0j+eij
iijjlmerY~X+Z+(1|group)+(0+X|Z)group
Азбука

50

Общая хитрость, как уже упоминалось в другом ответе , заключается в том, что формула следует форме dependent ~ independent | grouping. grouping, Как правило , случайный фактор, вы можете включать в себя фиксированные факторы , без какой - либо группировки , и вы можете иметь дополнительные случайные факторы без какого - либо фиксированного фактора (перехват только модель). А +между факторами указывает на отсутствие взаимодействия, а *указывает на взаимодействие.

Для случайных факторов у вас есть три основных варианта:

  1. Перехватывает только случайным образом: (1 | random.factor)
  2. Склоны только по случайному коэффициенту: (0 + fixed.factor | random.factor)
  3. Перехватывает и наклоняет случайным образом: (1 + fixed.factor | random.factor)

Обратите внимание, что вариант 3 имеет наклон и точку пересечения, рассчитанные в одной и той же группе, то есть в одно и то же время. Если мы хотим, чтобы наклон и пересечение вычислялись независимо, т.е. без какой-либо предполагаемой корреляции между ними, нам нужен четвертый вариант:

  • Intercept и наклон, отдельно от случайного фактора: (1 | random.factor) + (0 + fixed.factor | random.factor). Альтернативный способ написать это - использовать двойную нотацию fixed.factor + (fixed.factor || random.factor).

В другом ответе на этот вопрос есть также хорошее резюме, на которое вы должны обратить внимание.

Если вы хотите немного углубиться в математику, Barr et al. (2013) lmerдовольно хорошо суммировали синтаксис в своей таблице 1, адаптированной здесь для соответствия ограничениям безбумажной уценки. Эта статья имела дело с психолингвистическими данными, поэтому два случайных эффекта - Subjectи Item.

Модели и lme4синтаксис эквивалентной формулы:

    • Ysi=β0+β1Xi+esi
    • N / A (не модель со смешанными эффектами)
    • Ysi=β0+S0s+β1Xi+esi
    • Y ∼ X+(1∣Subject)
    • Ysi=β0+S0s+(β1+S1s)Xi+esi
    • Y ∼ X+(1 + X∣Subject)
    • Ysi=β0+S0s+I0i+(β1+S1s)Xi+esi
    • Y ∼ X+(1 + X∣Subject)+(1∣Item)
    • Ysi=β0+S0s+I0i+β1Xi+esi
    • Y ∼ X+(1∣Subject)+(1∣Item)
    • Как (4), но , независимый S0sS1s
    • Y ∼ X+(1∣Subject)+(0 + X∣ Subject)+(1∣Item)
    • Ysi=β0+I0i+(β1+S1s)Xi+esi
    • Y ∼ X+(0 + X∣Subject)+(1∣Item)

Рекомендации:

Barr, Dale J, R. Levy, C. Scheepers und HJ Tily (2013). Структура случайных эффектов для проверки подтверждающей гипотезы: Сохраняйте ее максимальной . Журнал памяти и языка, 68: 255–278.


4
Приятно. Может быть лучше узнать информацию о вложенных факторах «/» и двойную нотацию ||
Скан

1
Что насчет символа?
17

1
@eastafri Это означает, что то же самое, что и везде в R (формулы), - взаимодействие двух переменных.
Ливий

В (6) я понимаю, что и имеют никакой корреляции между ними. Другими словами, в качестве случайных величин их ковариация равна . Сказать, что и независимы, является более сильным утверждением и, следовательно, не обязательно верно. Я ошибаюсь? S 1 с 0 S 0 с S 1 сS0sS1s0S0sS1s
Муно

4

|Символ указывает на группировку фактора в смешанных методов.

Согласно Пиньейру и Бейтсу:

... Формула также обозначает ответ и, если возможно, первичный ковариат . Это дано как

response ~ primary | grouping

где response- выражение для ответа, primaryвыражение для основного ковариата и groupingвыражение для фактора группировки.

В зависимости от того, какой метод вы используете для анализа смешанных методов R, вам может потребоваться создать groupedDataобъект, чтобы иметь возможность использовать группировку в анализе (подробности см. В nlmeпакете, lme4кажется, в этом нет необходимости). Я не могу говорить с тем, как вы указали свои lmerмодельные высказывания, потому что я не знаю ваших данных. Однако наличие множества (1|foo)в модельном ряду необычно из того, что я видел. Что вы пытаетесь смоделировать?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.