Рассмотрим простую линейную смешанную модель, например, модель случайного перехвата, где мы оцениваем зависимость от у разных субъектов, и предполагаем, что у каждого субъекта есть свой случайный перехват:Здесь перехваты моделируются как поступающие из гауссовского распределения а случайный шум также является гауссовымВ синтаксисе эта модель будет записана как .x y = a + b x + c i + ϵ . c i c i ∼ N ( 0 , τ 2 ) ϵ ∼ N ( 0 , σ 2 ) .yx
y=a+bx+ci+ϵ.
cici∼N(0,τ2)
ϵ∼N(0,σ2).
lme4
y ~ x + (1|subject)
Поучительно переписать вышесказанное следующим образом:
y∣c∼N(a+bx+c,σ2)c∼N(0,τ2)
Это более формальный способ указать ту же вероятностную модель. Из этой формулировки мы можем непосредственно видеть, что случайные эффекты не являются «параметрами»: они являются ненаблюдаемыми случайными величинами. Так как же мы можем оценить параметры дисперсии, не зная значений ? сcic
Обратите внимание, что первое уравнение, приведенное выше, описывает условное распределение учетом . Если мы знаем распределение и , то мы можем определить безусловное распределение , интегрируя по . Вы можете знать это как Закон полной вероятности . Если оба распределения являются гауссовыми, то результирующее безусловное распределение также является гауссовым.yccy∣cyc
В этом случае безусловным распределением является просто , но наши наблюдения не являются образцами из него, поскольку существует несколько измерений на субъект. Чтобы продолжить, нам нужно рассмотреть распределение всего мерного вектора всех наблюдений: где - это блок-диагональная матрица, состоящая из и . Вы просили интуицию, поэтому я хочу избежать математики. Важным моментом является то, что это уравнение не имеетN(a+bx,σ2+τ2)ny
y∼N(a+bx,Σ)
Σ=σ2In+τ2IN⊗1Mσ2τ2cбольше!
Это то, что в действительности соответствует наблюдаемым данным, и поэтому говорят, что не являются параметрами модели.
ci
Когда параметры , , и подходят, можно определить условное распределение для каждого . То, что вы видите на выходе смешанной модели, это режимы этих распределений, или условные режимы.abτ2σ2cii