Как оценить компоненты дисперсии с помощью lmer для моделей со случайными эффектами и сравнить их с результатами lme


14

Я выполнил эксперимент, в котором я воспитывал разные семьи из двух разных групп населения. Каждой семье был назначен один из двух видов лечения. После эксперимента я измерил несколько признаков на каждого человека. Чтобы проверить эффект лечения или источника, а также их взаимодействие, я использовал линейную модель смешанного эффекта с семейством в качестве случайного фактора, т.е.

lme(fixed=Trait~Treatment*Source,random=~1|Family,method="ML")

пока все хорошо, теперь я должен вычислить относительные компоненты дисперсии, то есть процент изменения, который объясняется либо обработкой или источником, а также взаимодействием.

Без случайного эффекта я мог бы легко использовать суммы квадратов (SS) для вычисления дисперсии, объясняемой каждым фактором. Но для смешанной модели (с оценкой ML) SS не существует, поэтому я подумал, что мог бы использовать Лечение и Источник в качестве случайных эффектов для оценки дисперсии, т.е.

lme(fixed=Trait~1,random=~(Treatment*Source)|Family, method="REML")

Однако в некоторых случаях lme не сходится, поэтому я использовал lmer из пакета lme4:

lmer(Trait~1+(Treatment*Source|Family),data=DATA)

Где я извлекаю отклонения из модели, используя функцию итога:

model<-lmer(Trait~1+(Treatment*Source|Family),data=regrexpdat)
results<-VarCorr(model)
variances<-results[,3]

Я получаю те же значения, что и с функцией VarCorr. Затем я использую эти значения для вычисления фактического процента отклонения, принимая сумму в качестве общего отклонения.

Я борюсь с интерпретацией результатов исходной модели Ime (с обработкой и источником в качестве фиксированных эффектов) и случайной моделью для оценки компонентов дисперсии (с обработкой и источником в качестве случайного эффекта). Я нахожу в большинстве случаев, что процент дисперсии, объясняемый каждым фактором, не соответствует значению фиксированного эффекта.

Например, для признака HD, Первоначальное время предполагает тенденцию к взаимодействию, а также значимость для лечения. Используя обратную процедуру, я обнаружил, что лечение имеет тенденцию, близкую к значительной. Однако, оценивая компоненты дисперсии, я обнаружил, что источник имеет наибольшую дисперсию, составляя до 26,7% от общей дисперсии.

Lme:

anova(lme(fixed=HD~as.factor(Treatment)*as.factor(Source),random=~1|as.factor(Family),method="ML",data=test),type="m")
                                      numDF denDF  F-value p-value
(Intercept)                                1   426 0.044523  0.8330
as.factor(Treatment)                       1   426 5.935189  0.0153
as.factor(Source)                          1    11 0.042662  0.8401
as.factor(Treatment):as.factor(Source)     1   426 3.754112  0.0533

И лмер

summary(lmer(HD~1+(as.factor(Treatment)*as.factor(Source)|Family),data=regrexpdat))
Linear mixed model fit by REML 
Formula: HD ~ 1 + (as.factor(Treatment) * as.factor(Source) | Family) 
   Data: regrexpdat 
    AIC    BIC logLik deviance REMLdev
 -103.5 -54.43  63.75   -132.5  -127.5
Random effects:
 Groups   Name                                      Variance  Std.Dev. Corr                 
 Family   (Intercept)                               0.0113276 0.106431                      
          as.factor(Treatment)                      0.0063710 0.079819  0.405               
          as.factor(Source)                         0.0235294 0.153393 -0.134 -0.157        
          as.factor(Treatment)L:as.factor(Source)   0.0076353 0.087380 -0.578 -0.589 -0.585 
 Residual                                           0.0394610 0.198648                      
Number of obs: 441, groups: Family, 13

Fixed effects:
            Estimate Std. Error t value
(Intercept) -0.02740    0.03237  -0.846

Отсюда мой вопрос: правильно ли я делаю? Или я должен использовать другой способ оценить количество отклонений, объясняемых каждым фактором (то есть Лечение, Источник и их взаимодействие). Например, будут ли размеры эффекта более подходящим способом?


Фактор лечения имеет в 40 раз больше степеней свободы, чем исходный фактор (псевдорепликация?). Это, несомненно, снижает значение P лечения.

Ответы:


1

Одним из распространенных способов определения относительного вклада каждого фактора в модель является удаление фактора и сравнение относительной вероятности с чем-то вроде теста хи-квадрат:

pchisq(logLik(model1) - logLik(model2), 1)

Поскольку способ вычисления вероятностей между функциями может немного отличаться, я обычно сравниваю их только для одного и того же метода.


1
не должно ли это быть 1-pchisq(logLik(model1) - logLik(model2), 1)?
user81411
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.