Вычисление повторяемости эффектов по модели Лмера


28

Я только что наткнулся на эту статью , в которой описывается, как вычислить повторяемость (или надежность, или внутриклассовую корреляцию) измерения с помощью моделирования смешанных эффектов. Код R будет:

#fit the model
fit = lmer(dv~(1|unit),data=my_data)

#obtain the variance estimates
vc = VarCorr(fit)
residual_var = attr(vc,'sc')^2
intercept_var = attr(vc$id,'stddev')[1]^2

#compute the unadjusted repeatability
R = intercept_var/(intercept_var+residual_var)

#compute n0, the repeatability adjustment
n = as.data.frame(table(my_data$unit))
    k = nrow(n)
    N = sum(n$Freq)
n0 = (N-(sum(n$Freq^2)/N))/(k-1)

#compute the adjusted repeatability
Rn = R/(R+(1-R)/n0)

Я полагаю, что этот подход также может быть использован для расчета достоверности эффектов (т. Е. Суммарного контрастного эффекта переменной с двумя уровнями), например:

#make sure the effect variable has sum contrasts
contrasts(my_data$iv) = contr.sum

#fit the model
fit = lmer(dv~(iv|unit)+iv,data=my_data)

#obtain the variance estimates
vc = VarCorr(fit)
residual_var = attr(vc,'sc')^2
effect_var = attr(vc$id,'stddev')[2]^2

#compute the unadjusted repeatability
R = effect_var/(effect_var+residual_var)

#compute n0, the repeatability adjustment
n = as.data.frame(table(my_data$unit,my_data$iv))
k = nrow(n)
N = sum(n$Freq)
    n0 = (N-(sum(n$Freq^2)/N))/(k-1)

#compute the adjusted repeatability
Rn = R/(R+(1-R)/n0)

Три вопроса:

  1. Имеют ли смысл приведенные выше вычисления для получения точечной оценки повторяемости эффекта?
  2. Когда у меня есть несколько переменных, повторяемость которых я хочу оценить, добавление их всех к одной и той же подгонке (например lmer(dv~(iv1+iv2|unit)+iv1+iv2) дает более высокие оценки повторяемости, чем создание отдельной модели для каждого эффекта. Это имеет смысл в вычислительном отношении для меня, так как включение нескольких эффектов будет иметь тенденцию уменьшать остаточную дисперсию, но я не уверен, что полученные оценки повторяемости действительны. Они?
  3. Приведенная выше статья предполагает, что профилирование правдоподобия может помочь мне получить доверительные интервалы для оценок повторяемости, но, насколько я могу судить, confint(profile(fit))предоставляет только интервалы для отклонений пересечения и эффекта, в то время как мне дополнительно понадобится интервал для вычисления остаточной дисперсии интервал для повторяемости, нет?

Ответы:


6

Я думаю, что могу ответить на ваши вопросы, по крайней мере, относительно нескорректированных оценок повторяемости, то есть классических внутриклассовых корреляций (ICC). Что касается «скорректированных» оценок повторяемости, я пролистал бумагу, которую вы связали, и не понял, где формула, которую вы применяете, находится в документе? Основываясь на математическом выражении, представляется, что это повторяемость средних баллов (а не отдельных баллов). Но не ясно, что это в любом случае критическая часть вашего вопроса, поэтому я проигнорирую это.

(1.) Имеют ли смысл приведенные выше вычисления для получения точечной оценки повторяемости эффекта?

Да, выражение, которое вы предлагаете, имеет смысл, но небольшая модификация предложенной вами формулы необходима. Ниже я покажу, как можно получить предложенный вами коэффициент повторяемости. Я надеюсь, что это проясняет концептуальное значение коэффициента, а также показывает, почему было бы желательно немного изменить его.

Для начала давайте сначала возьмем коэффициент повторяемости в вашем первом случае и уточним, что он означает и откуда он берется. Понимание этого поможет нам понять более сложный второй случай.

Только случайные перехваты

яJ

YяJзнак равноβ0+U0J+еяJ,
U0JσU02еяJσе2

ИксY

соррзнак равносоv(Икс,Y)vaр(Икс)vaр(Y),

ИксYJ

яССзнак равносоv(β0+U0J+ея1J,β0+U0J+ея2J)vaр(β0+U0J+ея1J)vaр(β0+U0J+ея2J),
яССзнак равноσU02σU02+σе2,

Случайные перехваты и случайные уклоны

Теперь для второго случая, мы должны сначала уточнить, что именно подразумевается под «надежностью эффектов (то есть суммарный эффект контраста переменной с двумя уровнями)» - ваши слова.

яJКИкс

YяJКзнак равноβ0+β1ИксК+U0J+U1JИксК+еяJК,
σU02σU12σU01еяJσе2

Jя

Икс|Икс1|знак равно|Икс2|знак равноИкс

Yя1JК2-Yя1JК1знак равно(β0-β0)+β1(ИксК2-ИксК1)+(U0J-U0J)+U1J(ИксК2-ИксК1)+(ея1JК2-ея1JК1)знак равно2Иксβ1+2ИксU1J+ея1JК2-ея1JК1
Yя2JК2-Yя2JК1знак равно2Иксβ1+2ИксU1J+ея2JК2-ея2JК1,

яССзнак равносоv(2Иксβ1+2ИксU1J+ея1JК2-ея1JК1,2Иксβ1+2ИксU1J+ея2JК2-ея2JК1)vaр(2Иксβ1+2ИксU1J+ея1JК2-ея1JК1)vaр(2Иксβ1+2ИксU1J+ея2JК2-ея2JК1),
яССзнак равно2Икс2σU122Икс2σU12+σе2,
ИксИкс

Икс±12

(2.) Когда у меня есть несколько переменных, повторяемость которых я хочу оценить, добавление их всех к одной и той же подгонке (например lmer(dv~(iv1+iv2|unit)+iv1+iv2) дает более высокие оценки повторяемости, чем создание отдельной модели для каждого эффекта. Это имеет смысл в вычислительном отношении для меня, так как включение нескольких эффектов будет иметь тенденцию уменьшать остаточную дисперсию, но я не уверен, что полученные оценки повторяемости действительны. Они?

Я полагаю, что проработка аналогичного деривации, представленной выше, для модели с несколькими предикторами с их собственными случайными наклонами показала бы, что приведенный выше коэффициент повторяемости все еще действителен, за исключением дополнительного усложнения, из-за которого оценки различий, которые мы концептуально заинтересованы, теперь есть немного другое определение: а именно, нас интересует ожидаемая корреляция различий между скорректированными средними значениями после учета других предикторов в модели.

Если другие предикторы ортогональны интересующему предиктору (как, например, в сбалансированном эксперименте), я думаю, что коэффициент ICC / повторяемости, разработанный выше, должен работать без каких-либо изменений. Если они не ортогональны, вам нужно изменить формулу, чтобы учесть это, что может стать сложным, но, надеюсь, мой ответ дал некоторые подсказки о том, как это может выглядеть.


ррN
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.