Написание математического уравнения для многоуровневой модели смешанных эффектов

Вопрос CV

Я пытаюсь дать (а) подробное и краткое математическое представление (я) модели смешанных эффектов. Я использую lme4пакет в R. Каково правильное математическое представление для моей модели?

Данные, научный вопрос и код R

Мой набор данных состоит из видов в разных регионах. Я проверяю, изменяется ли распространенность вида во время, ведущее к вымиранию (вымирание не обязательно является постоянным; оно может быть повторно заселено), или после колонизации.

lmer(prevalence ~ time + time:type + (1 + time + type:time | reg) + (1 + time + type:time | reg:spp))

Распространенность - это доля страт, занимаемых видом в регионе-году
Время - это непрерывная переменная, которая указывает время до исчезновения или колонизации; это всегда позитивно
Тип - это категориальная переменная с двумя уровнями. Эти два уровня - «-» и «+». Когда тип - - это колонизация (уровень по умолчанию). Когда тип +, это вымирание.
Reg - это категориальная переменная с девятью уровнями, указывающая регион
Spp - категориальная переменная; количество уровней варьируется между регионами и варьируется между 48 уровнями и 144 уровнями.

На словах: переменная ответа - распространенность (доля занятых слоев). Фиксированные эффекты включали 1) и перехват, 2) время от события и 3) взаимодействие между временем события и типом события (колонизация или вымирание). Каждый из этих 3 фиксированных эффектов варьировался случайным образом в разных регионах. Внутри региона каждый эффект варьировался случайным образом среди видов.

Я пытаюсь понять, как написать математическое уравнение для модели. Я думаю, что понимаю, что происходит в коде R (хотя, я уверен, у меня есть некоторые пробелы в знаниях, и, надеюсь, выписывание формального математического выражения улучшит мое понимание).

Я немного искал в Интернете и на этих форумах. Конечно, я нашел тонны полезной информации (и, возможно, я добавлю ссылки на некоторые из них в редактировании этого вопроса). Тем не менее, я не мог найти тот «Rosetta Stone» из R-кода, переведенный в математику (мне удобнее с кодом), который действительно помог бы мне подтвердить, что я правильно понял эти уравнения. На самом деле, я знаю, что уже есть некоторые пробелы, но мы вернемся к этому.

Моя попытка

Базовая форма модели смешанных эффектов в матричной записи (на мой взгляд):

Y знак равно Икс β + Z γ + ε

$Y = X \beta + Z \gamma + \epsilon$

Икс знак равно [\begin{matrix} 1 & Δ T & Δ T_{+} \\ ⋮ & ⋮ & ⋮ \\ 1 & Δ T_{N} & Δ T_{+, N} \end{matrix}]

$X = \begin{bmatrix} 1 & \Delta t & \Delta t_{+} \\ \vdots & \vdots & \vdots \\ 1 & \Delta t_n & \Delta t_{+,n} \end{bmatrix}$

β^{^{'}} знак равно [\begin{matrix} β_{0} & β_{1} & β_{2} \end{matrix}]

$\beta^{'} = \begin{bmatrix} \beta_0 & \beta_1 & \beta_2 \end{bmatrix}$

Z знак равно [\begin{matrix} 1 я (р_{1}) & Δ T я (р_{1}) & Δ T_{+} я (р_{1}) & ... & 1 я (р_{9}) & Δ T я (р_{9}) & Δ T_{+} я (р_{9}) \\ ⋮ & ⋮ & ⋮ & ⋱ & ⋮ & ⋮ & ⋮ \\ 1 я (р_{1, N}) & Δ T_{N} я (р_{1, N}) & Δ T_{+, N} я (р_{1, N}) & ... & 1 я (р_{9, N}) & Δ T я (р_{9, N}) & Δ T_{+, N} я (р_{9, N}) \end{matrix}]

$Z = \begin{bmatrix} 1 I(r_1) & \Delta t I(r_1) & \Delta t_{+} I(r_1) & \dots & 1 I(r_9) & \Delta t I(r_9) & \Delta t_{+} I(r_9) \\ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots & \vdots \\ 1 I(r_{1,n}) & \Delta t_n I(r_{1,n}) & \Delta t_{+,n} I(r_{1,n}) & \dots & 1 I(r_{9,n}) & \Delta t I(r_{9,n}) & \Delta t_{+,n} I(r_{9,n}) \\ \end{bmatrix}$

γ^{^{'}} знак равно [\begin{matrix} γ_{0, 1} & γ_{1, 1} & γ_{2, 1} & ... & γ_{0, 9} & γ_{1, 9} & γ_{2, 9} \end{matrix}]

$\gamma^{'} = \begin{bmatrix} \gamma_{0,1} & \gamma_{1,1} &\gamma_{2,1} & \dots & \gamma_{0,9} & \gamma_{1,9} &\gamma_{2,9} \end{bmatrix}$

ε ~ N (0, Σ)

$\epsilon \sim \mathcal{N}(0,\Sigma)$

$X$ - матрица дизайна для фиксированных эффектов, - время после колонизации ( ), а - время после исчезновения ( ) $\Delta t$ time $\Delta t_{+}$ time:type
$Z$ - матрица дизайна для случайных эффектов (уровень 1?), I () - функция индикатора, дающая 1, если выборка принадлежит назначенной области, и 0, в противном случае r индексируется, чтобы указать одну из девяти областей.
$\beta$ и содержат параметры $\gamma$
$\epsilon$ - это ошибки; Я не совсем уверен, как объяснить , хотя я понимаю, что одна из этих матриц дисперсии / ковариации будет выражать ковариации между наклонами и перехватами, например $\Sigma$

Предполагая, что все пока что ~ правильно, это означает, что я хорошо на высшем уровне. Однако объяснение видоспецифического изменения параметров, вложенного в каждый регион, поставило меня в тупик еще больше.

Но я взломал что-то, что может иметь смысл ...

Каждый из параметров в получен из линейной комбинации видоспецифичных предикторов и параметров в пределах региона. Для каждого региона есть 3 строки, соответствующие 3 переменным предиктора. Каждая может быть индивидуально выражена как $\gamma$ $\gamma$

- где является расчетной матрицей, специфичной для области а предиктор , является матрицей 1 на S параметров для региона (богатство в области = , например, 48 или 144), и является матрицей ошибок $U_{p,r}$ $r$ $p$ $b_{p,r}$ $S$ $\eta_{p,r}$

В частности, для данного региона каждый из будет: $\gamma_{p,r}$

γ_{0, р} знак равно U_{0, р} б_{0, р} + η_{0, р}

$\gamma_{0,r} = U_{0,r} b_{0,r} + \eta_{0,r}$

γ_{0, р} знак равно [\begin{matrix} 1 я (s_{1}) ... 1 я (s_{S}) \end{matrix}] + [\begin{matrix} б_{0, 1} \\ ⋮ \\ б_{0, S} \end{matrix}] + η_{0, р}

$\gamma_{0,r} = \begin{bmatrix} 1 I(s_1) \dots 1 I(s_S) \end{bmatrix} + \begin{bmatrix} b_{0,1}\\ \vdots \\ b_{0,S} \end{bmatrix} + \eta_{0,r}$

γ_{1, р} знак равно U_{1, р} б_{1, р} + η_{1, р}

$\gamma_{1,r} = U_{1,r} b_{1,r} + \eta_{1,r}$

γ_{1, р} знак равно [\begin{matrix} Δ T я (s_{1}) ... Δ T я (s_{S}) \end{matrix}] + [\begin{matrix} б_{1, 1} \\ ⋮ \\ б_{1, S} \end{matrix}] + η_{1, р}

$\gamma_{1,r} = \begin{bmatrix} \Delta t I(s_1) \dots \Delta t I(s_S) \end{bmatrix} + \begin{bmatrix} b_{1,1}\\ \vdots \\ b_{1,S} \end{bmatrix} + \eta_{1,r}$

γ_{2, р} знак равно U_{2, р} б_{2, р} + η_{2, р}

$\gamma_{2,r} = U_{2,r} b_{2,r} + \eta_{2,r}$

γ_{2, р} знак равно [\begin{matrix} Δ T_{+} я (s_{1}) ... Δ T_{+} я (s_{S}) \end{matrix}] + [\begin{matrix} б_{2, 1} \\ ⋮ \\ б_{2, S} \end{matrix}] + η_{2, р}

$\gamma_{2,r} = \begin{bmatrix} \Delta t_+ I(s_1) \dots \Delta t_+ I(s_S) \end{bmatrix} + \begin{bmatrix} b_{2,1}\\ \vdots \\ b_{2,S} \end{bmatrix} + \eta_{2,r}$

Это будет повторяться для каждого региона. Затем , например . Хотя, возможно, вместо , есть еще одна буква, например , которая обычно используется. $\eta \sim \mathcal{N}(0,\Sigma_{\eta})$ $\epsilon$ $\Sigma$ $G$

Редактировать: другие вопросы и ответы, которые были несколько полезны

Этот Q / A был хорош, но не выписывал вещи в полной матричной форме

r mixed-model multilevel-analysis lme4-nlme

— rbatt
источник

Я сомневаюсь, что эта статья имеет «ответ» на ваш вопрос, но она послужила мне хорошим примером для уравнений модели HMM. Забудьте, что он укоренен в SAS, это просто отличный обзор этого класса моделей. Джудит Сингер, Использование SAS Proc, смешанного для многоуровневых моделей, иерархических моделей и моделей индивидуального роста, JEBS , Winter 1998, vol. 24, № 4, с. 323-355.

— Майк Хантер

Вы читали раздел 2.3 здесь ?

— Роберт Лонг

Я прочитал их, и такие ресурсы позволили мне зайти так далеко. Возможно, мне нужно просто продолжать попытки, но я не смог найти достаточно сложный пример, чтобы дать мне достаточную уверенность в моем нынешнем подходе.

— rbatt

Насколько я понимаю, "вложение" - это просто взаимодействие в моделях lmer. Это понятие подкрепляется использованием того же синтаксиса. Поэтому я считаю, что reg: spp может обрабатываться одной категориальной переменной и просто другим набором блоков в Z.

— deasmhumnha

Я также предположил бы, что lmer будет избегать идеальной коллинеарности и включит не избыточные взаимодействия в дополнительную переменную.

— Деасмумнха

Если я правильно понял код, почему бы просто не написать что-то вроде

Y_{я} знак равно (α + ν_{J [я]}^{(α)} + η_{К [я]}^{(α)}) + (β + ν_{J [я]}^{(β)} + η_{К [я]}^{(β)}) T_{я} + (δ + ν_{J [я]}^{(δ)} + η_{К [я]}^{(δ)}) (T_{я} * Z_{я}) + ε_{я}

$y_{i} = \Big(\alpha + \nu_{j[i]}^{(\alpha)} + \eta_{k[i]}^{(\alpha)}\Big) + \Big(\beta + \nu_{j[i]}^{(\beta)} + \eta_{k[i]}^{(\beta)}\Big)T_{i} + \Big(\delta + \nu_{j[i]}^{(\delta)} + \eta_{k[i]}^{(\delta)}\Big)(T_{i} * Z_{i}) + \epsilon_i$ с или, если первое уравнение слишком длинное, что-то вроде и

\begin{aligned} [ν_{J}^{(α)}, ν_{J}^{(β)}, ν_{J}^{(δ)}] & ~ Multi-Normal (0, Σ_{ν}) \\ [η_{J}^{(α)}, η_{J}^{(β)}, η_{J}^{(δ)}] & ~ Multi-Normal (0, Σ_{η}) \\ ε_{я} & ~ Обычный (0, σ_{ε}) \end{aligned}

$\begin{aligned} \Big[\nu_{j}^{(\alpha)}, \nu_j^{(\beta)}, \nu_j^{(\delta)}\Big] &\sim \text{Multi-Normal}(\mathbf 0, \boldsymbol \Sigma_\nu) \\ \Big[\eta_{j}^{(\alpha)}, \eta_j^{(\beta)}, \eta_j^{(\delta)}\Big] &\sim \text{Multi-Normal}(\mathbf 0, \boldsymbol \Sigma_\eta)\\ \epsilon_i & \sim \text{Normal}(0, \sigma_\epsilon) \end{aligned}$

Y_{я} знак равно α_{J [я], К [я]} + β_{J [я], К [я]} T_{я} + δ_{J [я], К [я]} (T_{я} * Z_{я}) + ε_{я}

$y_{i} = \alpha_{j[i],k[i]} + \beta_{j[i],k[i]}T_{i} + \delta_{j[i],k[i]}(T_i * Z_i) + \epsilon_i$

\begin{aligned} α_{J [я], К [я]} & знак равно α + ν_{J}^{(α)} + η_{К}^{(α)} \\ β_{J [я], К [я]} & знак равно β + ν_{J}^{(β)} + η_{К}^{(β)} \\ δ_{J [я], К [я]} & знак равно δ + ν_{J}^{(δ)} + η_{К}^{(δ)} \end{aligned}

$\begin{aligned} \alpha_{j[i],k[i]} &= \alpha + \nu_{j}^{(\alpha)} + \eta_{k}^{(\alpha)} \\ \beta_{j[i],k[i]}&=\beta + \nu_{j}^{(\beta)} + \eta_{k}^{(\beta)}\\ \delta_{j[i],k[i]}&=\delta + \nu_{j}^{(\delta)} + \eta_{k}^{(\delta)}\\ \end{aligned}$ с той же ковариационной структурой как указано выше? Он показывает вложенную структуру данных, а также то, какие коэффициенты различаются на разных уровнях.

— baruuum
источник