Я чувствую себя ошеломленным после того, как попытаюсь покопаться в литературе о том, как проводить анализ смешанной модели, следуя его примеру с использованием AIC, чтобы выбрать лучшую модель или модели. Я не думаю, что мои данные настолько сложны, но я ищу подтверждение того, что я сделал правильно, а затем советую, как поступить. Я не уверен, должен ли я использовать Ime или Lmer, а затем с любым из них, если я должен использовать REML или ML.
У меня есть значение выбора, и я хочу знать, какие ковариаты лучше всего влияют на это значение и позволяют делать прогнозы. Вот некоторые примерные данные и мой код для моего теста, с которым я работаю:
ID=as.character(rep(1:5,3))
season=c("s","w","w","s","s","s","s","w","w","w","s","w","s","w","w")
time=c("n","d","d","n","d","d","n","n","n","n","n","n","d","d","d")
repro=as.character(rep(1:3,5))
risk=runif(15, min=0, max=1.1)
comp1=rnorm(15, mean = 0, sd = 1)
mydata=data.frame(ID, season, time, repro, risk, comp1)
c1.mod1<-lmer(comp1~1+(1|ID),REML=T,data=mydata)
c1.mod2<-lmer(comp1~risk+(1|ID),REML=T,data=mydata)
c1.mod3<-lmer(comp1~season+(1|ID),REML=T,data=mydata)
c1.mod4<-lmer(comp1~repro+(1|ID),REML=T,data=mydata)
c1.mod5<-lmer(comp1~time+(1|ID),REML=T,data=mydata)
c1.mod6<-lmer(comp1~season+repro+time+(1|ID),REML=T,data=mydata)
c1.mod7<-lmer(comp1~risk+season+season*time+(1|ID),REML=T,data=mydata)
У меня есть ~ 19 моделей, которые изучают эти данные с различными комбинациями и до двухсторонних терминов взаимодействия, но всегда с ID в качестве случайного эффекта и comp1 в качестве моей зависимой переменной.
- Q1. Какой использовать? или я? это имеет значение?
В обоих случаях у меня есть возможность использовать ML или REML - и я получаю совершенно разные ответы - используя ML и AIC, я получаю 6 моделей со схожими значениями AIC, а комбинации моделей просто не имеют смысла, тогда как REML в результате 2 из наиболее вероятных моделей являются лучшими. Однако при запуске REML я больше не могу использовать anova.
- Q2. является основной причиной использования ML поверх REML из-за использования с ANOVA? Это мне не понятно.
Я до сих пор не могу запустить stepAIC или не знаю другого способа сузить эти 19 моделей.
- Q3. Есть ли способ использовать stepAIC на этом этапе?