Пусть обозначает ответ и вектор предиктора (соответственно) учащегося i в школе j .Yя ж, хя жяJ
(1) Для двоичных данных, я думаю, что стандартный способ сделать разложение дисперсии, аналогичное тому, что делается для непрерывных данных, - это то, что авторы называют метод D (я прокомментирую другие методы ниже) в вашей ссылке - представляя двоичные данные как возникающих из базовой непрерывной переменной, которая управляется линейной моделью и разлагает дисперсию по этой скрытой шкале. Причина в том, что логистические модели (и другие GLM) естественным образом возникают таким образом:
Чтобы увидеть это, определите , чтобы оно регулировалось линейной смешанной моделью:Y⋆я ж
Y⋆я ж= α + xя жβ + ηJ+ εя ж
где - коэффициенты регрессии,α , β - случайный эффект школьного уровня, а ε i j - остаточный член дисперсии и имеет стандартноелогистическое распределение. Теперь давайηJ∼ N( 0 , σ2)εя ж
Yя ж= ⎧⎩⎨⎪⎪10если у ⋆я ж≥ 0если у ⋆я ж< 0
пусть теперь y i j = 1 | x i j , η j ) , просто используя логистический CDF, который мы имеемпя ж= P( уя ж= 1 | Икся ж, пJ)
пя ж=1−P(y⋆ij<0|xij,ηj)=exp{−(α+xijβ+ηj)}1+exp{−(α+xijβ+ηj)}
Теперь, принимая логит-преобразование с обеих сторон, у вас есть
log(pij1−pij)=α+xijβ+ηj
которая является именно моделью логистических смешанных эффектов. Таким образом, логистическая модель эквивалентна модели скрытой переменной, указанной выше. Одно важное замечание:
- Шкала не определена, так как, если бы вы уменьшили ее, но константу s , она просто изменила бы вышеприведенное значение наεijs
exp{−(α+xijβ+ηj)/s}1+exp{−(α+xijβ+ηj)/s}
следовательно, коэффициенты и случайные эффекты будут просто увеличены на соответствующую величину. Итак, s = 1 используется, что подразумевает v
s=1 .var(εij)=π2/3
Теперь, если вы используете эту модель, а затем количество
σ^2ησ^2η+π2/3
оценивает внутриклассовую корреляцию скрытых скрытых переменных . Еще одно важное замечание:
- Если вместо указано стандартное нормальное распределение, то у вас есть пробитная модель со смешанными эффектами . В таком случаеεijоцениваеттетрахорическая корреляциямежду двумя случайно выбранными учениками в той же школе, что были показаны Пирсоном (около 1900 я думаю)чтобы быть статистически определенакогда основные непрерывные данные были нормально распределены (эта работа действительно показала эти корреляции были определены за пределами двоичного случая для случая нескольких категорий, где эти корреляции называютсяполихорическими корреляциями). По этой причине может быть предпочтительным (и я рекомендую это) использовать пробитную модель, когда основной интерес представляет оценка (тетрахорической) внутриклассовой корреляции двоичных данных.
σ^2ησ^2η+1
Что касается других методов, упомянутых в статье, которую вы связали:
xij
(B) Метод моделирования интуитивно привлекателен для статистики, так как он даст вам оценку разложения дисперсии в исходном масштабе данных, но, в зависимости от аудитории, это может (i) быть сложно описать в ваших «методах» раздел и (ii) может отключить рецензента, который искал что-то «более стандартное»
(C) Притворяться, что данные непрерывны, вероятно, не очень хорошая идея, хотя они не будут работать ужасно, если большинство вероятностей не слишком близко к 0 или 1. Но выполнение этого почти наверняка вызовет красный флаг у рецензента. так что я бы держался подальше.
Теперь, наконец,
(2) Если фиксированные эффекты сильно различаются по годам, то вы правы, полагая, что может быть трудно сравнивать случайные отклонения эффектов по годам, поскольку они потенциально имеют разные масштабы (это связано с неидентифицируемостью). упомянутой выше проблемы масштабирования).
Ik=1k
α+xijβ+η1jI1+η2jI2+η3jI3+η4jI4+η5jI5+η6jI6
это даст вам разные ICC каждый год, но одинаковые фиксированные эффекты. Может быть заманчиво просто использовать случайный наклон во времени, делая ваш линейный предиктор
α+xijβ+η1+η2t
but I don't recommend this, since that will only allow your associations to increase over time, not decrease.