Эквивалентность (0 + фактор | группа) и (1 | группа) + (1 | группа: фактор) характеристики случайных эффектов в случае составной симметрии

Дуглас Бейтс утверждает, что следующие модели эквивалентны «если матрица дисперсии-ковариации для векторно-значных случайных эффектов имеет особую форму, называемую составной симметрией» ( слайд 91 в этой презентации ):

m1 <- lmer(y ~ factor + (0 + factor|group), data)
m2 <- lmer(y ~ factor + (1|group) + (1|group:factor), data)

В частности, Бейтс использует этот пример:

library(lme4)
data("Machines", package = "MEMSS")

m1a <- lmer(score ~ Machine + (0 + Machine|Worker), Machines)
m2a <- lmer(score ~ Machine + (1|Worker) + (1|Worker:Machine), Machines)

с соответствующими выходами:

print(m1a, corr = FALSE)

Linear mixed model fit by REML ['lmerMod']
Formula: score ~ Machine + (0 + Machine | Worker)
   Data: Machines
REML criterion at convergence: 208.3112
Random effects:
 Groups   Name     Std.Dev. Corr     
 Worker   MachineA 4.0793            
          MachineB 8.6253   0.80     
          MachineC 4.3895   0.62 0.77
 Residual          0.9616            
Number of obs: 54, groups:  Worker, 6
Fixed Effects:
(Intercept)     MachineB     MachineC  
     52.356        7.967       13.917  

print(m2a, corr = FALSE)

Linear mixed model fit by REML ['lmerMod']
Formula: score ~ Machine + (1 | Worker) + (1 | Worker:Machine)
   Data: Machines
REML criterion at convergence: 215.6876
Random effects:
 Groups         Name        Std.Dev.
 Worker:Machine (Intercept) 3.7295  
 Worker         (Intercept) 4.7811  
 Residual                   0.9616  
Number of obs: 54, groups:  Worker:Machine, 18; Worker, 6
Fixed Effects:
(Intercept)     MachineB     MachineC  
     52.356        7.967       13.917

Кто-нибудь может объяснить разницу между моделями и как m1сводится к m2(с учетом составной симметрии) интуитивно понятным способом?

— statmerkur
источник

+1 и, имхо, это абсолютно по теме. Проголосовать, чтобы открыть.

— говорит амеба, восстанови Монику

@ Питер Флом, почему вы считаете этот вопрос не по теме?

— statmerkur

Возможно, не было ясно, что вы спрашивали о моделях, а не о lme4синтаксисе. Было бы полезно - и расширить круг потенциальных ответчиков - если бы вы объяснили их людям, с которыми незнакомы lme4.

— Scortchi - Восстановить Монику

Похоже, речь идет о кодировании.

— Питер Флом - Восстановить Монику

Если это полезно, вот два хороших поста о том, что делает синтаксис lme4, и что такое составная симметрия в контексте смешанных моделей (см. Принятые ответы на оба вопроса). stats.stackexchange.com/questions/13166/rs-lmer-cheat-sheet и stats.stackexchange.com/questions/15102/…

— Джейкоб Соколар

В этом примере есть три наблюдения для каждой комбинации трех машин (A, B, C) и шести рабочих. Я буду использовать для обозначения мерной единичной матрицы и для обозначения мерного вектора единиц. Скажем, - вектор наблюдений, который, как я предполагаю, упорядочен рабочим, затем машиной, а затем воспроизведен. Пусть будет соответствующими ожидаемыми значениями (например, фиксированными эффектами), и пусть будет вектором групповых отклонений от ожидаемых значений (например, случайных эффектов). Условно на модель для можно записать так: $I_n$ $n$ $1_n$ $n$ $y$ $\mu$ $\gamma$ $\gamma$ $y$

y \sim N (μ + γ, σ_{y}^{2} I_{54})

$y \sim \mathcal{N}(\mu + \gamma, \sigma^2_y I_{54})$

где - «остаточная» дисперсия. $\sigma^2_y$

Чтобы понять, как ковариационная структура случайных эффектов индуцирует ковариационную структуру среди наблюдений, более интуитивно понятно работать с эквивалентным «маргинальным» представлением , которое интегрируется по случайным эффектам . Предельная форма этой модели, $\gamma$

y \sim N (μ, σ_{y}^{2} I_{54} + Σ)

$y \sim \mathcal{N}(\mu, \sigma^2_y I_{54} + \Sigma)$

Здесь - ковариационная матрица, которая зависит от структуры (например, «компоненты дисперсии», лежащие в основе случайных эффектов). Я буду называть «маргинальной» ковариацией. $\Sigma$ $\gamma$ $\Sigma$

По вашему m1, случайные эффекты разлагаются на:

γ = Z θ

$\gamma = Z \theta$

Там , где является дизайн матрица , которая отображает случайные коэффициенты на наблюдения, а представляет собой 18-мерный вектор случайных коэффициентов упорядоченных по рабочим затем машина, и распределяются следующим образом: $Z = I_{18} \otimes 1_3$ $\theta^T = [\theta_{1,A}, \theta_{1,B}, \theta_{1,C} \dots \theta_{6,A}, \theta_{6,B}, \theta_{6,C}]$

θ \sim N (0, I_{6} \otimes Λ)

$\theta \sim \mathcal{N}(0, I_6 \otimes \Lambda)$

Здесь - ковариация случайных коэффициентов. Предположение о сложной симметрии означает, что имеет два параметра, которые я назову и , и структуру: $\Lambda$ $\Lambda$ $\sigma_\theta$ $\tau$

Λ = [\begin{matrix} σ_{θ}^{2} + τ^{2} & τ^{2} & τ^{2} \\ τ^{2} & σ_{θ}^{2} + τ^{2} & τ^{2} \\ τ^{2} & τ^{2} & σ_{θ}^{2} + τ^{2} \end{matrix}]

$\Lambda = \left[\begin{matrix} \sigma^2_\theta + \tau^2 & \tau^2 & \tau^2 \\ \tau^2 & \sigma^2_\theta + \tau^2 & \tau^2 \\ \tau^2 & \tau^2 & \sigma^2_\theta + \tau^2 \end{matrix}\right]$

(Другими словами, корреляционная матрица, лежащая в основе имеет все элементы на диагонали, установленные на одно и то же значение.) $\Lambda$

Предельная структура ковариации , вызванная этими случайных эффектов является , так что дисперсия данного наблюдения является и ковариации между двумя (отдельными) наблюдениями от работников и машин is: $\Sigma = Z (I_6 \otimes \Lambda) Z^T$ $\sigma^2_\theta + \tau^2 + \sigma^2_y$ $i, j$ $u, v$

c o v (y_{i, u}, y_{j, v}) = {\begin{cases} 0 & if i \neq j \\ τ^{2} & if i = j, u \neq v \\ σ_{θ}^{2} + τ^{2} & if i = j, u = v \end{cases}

$\mathrm{cov}(y_{i,u}, y_{j,v}) = \begin{cases} 0 & \text{if } i\neq j \\ \tau^2 & \text{if } i=j, u\neq v \\ \sigma^2_\theta + \tau^2 & \text{if } i=j, u=v \end{cases}$

Для вас m2случайные эффекты разлагаются на:

γ = Z ω + X η

$\gamma = Z \omega + X \eta$

$X = I_6 \otimes 1_9$ $\omega^T = [\omega_{1,A}, \omega_{1,B}, \omega_{1,C}, \dots, \omega_{6,A}, \omega_{6,B}, \omega_{6,C}]$ $\eta^T = [\eta_{1}, \dots, \eta_{6}]$

η \sim N (0, σ_{η}^{2} I_{6})

$\eta \sim \mathcal{N}(0, \sigma^2_\eta I_6)$

ω \sim N (0, σ_{ω}^{2} I_{18})

$\omega \sim \mathcal{N}(0, \sigma^2_\omega I_{18})$

σ_{η}^{2}, σ_{ω}^{2}

$\sigma_\eta^2, \sigma_\omega^2$

m2 $\Sigma = \sigma^2_\omega Z Z^T + \sigma^2_\eta X X^T$ $\sigma^2_\omega + \sigma^2_\eta + \sigma^2_y$ $i, j$ $u, v$

c o v (y_{i, u}, y_{j, v}) = {\begin{cases} 0 & if i \neq j \\ σ_{η}^{2} & if i = j, u \neq v \\ σ_{ω}^{2} + σ_{η}^{2} & if i = j, u = v \end{cases}

$\mathrm{cov}(y_{i,u}, y_{j,v}) = \begin{cases} 0 & \text{if } i\neq j \\ \sigma_\eta^2 & \text{if } i=j,u\neq v \\ \sigma^2_\omega + \sigma^2_\eta & \text{if } i=j,u=v \end{cases}$

$\sigma^2_\theta \equiv \sigma^2_\omega$ $\tau^2 \equiv \sigma^2_\eta$ m1

Краткость не является моей сильной стороной: это всего лишь длинный, запутанный способ сказать, что каждая модель имеет два параметра дисперсии для случайных эффектов, и это просто два разных способа написания одной и той же «маргинальной» модели.

В коде ...

sigma_theta <- 1.8
tau         <- 0.5
sigma_eta   <- tau
sigma_omega <- sigma_theta
Z <- kronecker(diag(18), rep(1,3))
rownames(Z) <- paste(paste0("worker", rep(1:6, each=9)), 
                     rep(paste0("machine", rep(1:3, each=3)),6))
X <- kronecker(diag(6), rep(1,9))
rownames(X) <- rownames(Z)
Lambda <- diag(3)*sigma_theta^2 + tau^2

# marginal covariance for m1:
Z%*%kronecker(diag(6), Lambda)%*%t(Z)
# for m2:
X%*%t(X)*sigma_eta^2 + Z%*%t(Z)*sigma_omega^2

— Нейт Папа
источник

Очень хороший ответ! Но я думаю, что фраза «машина, вложенная в работника» может вводить в заблуждение, поскольку одни и те же три машины появляются на более чем одном (фактически, каждом) уровне работника.

— statmerkur

@statmerkur Спасибо, я попытался уточнить эту строку. Дайте мне знать, если у вас есть другое предложение.

— Нейт Папа

Должен

X

$X$ определяться как

X = I_{6} \otimes 1_{9}

$X = I_6 \otimes 1_9$ ?

— С. Каттералл восстановил Монику

@S.Catterall Yup, that's a typo -- thanks for catching it! I've fixed in my answer.

— Nate Pope

@statmerkur Вы можете уточнить, что вы имеете в виду? Здесь нет непрерывных ковариат, поэтому не уверен, что вы подразумеваете под «уклоном». То, как я думаю о модели, заключается в том, что существуют систематические различия в среднем отклике между машинами (фиксированные эффекты); затем случайное отклонение для каждого работника (случайные перехваты / работник); затем случайное отклонение для каждой комбинации машина-рабочий; и, наконец, случайное отклонение за наблюдение. Чем больше дисперсия случайных отклонений на одного работника, тем больше будет коррелированных наблюдений от данного работника и т. Д.

— Нейт Папа