контекст
В этом вопросе используется R, но речь идет об общих статистических вопросах.
Я анализирую влияние факторов смертности (% смертности от болезней и паразитов) на скорость роста популяции моли с течением времени, когда популяция личинок отбиралась из 12 мест один раз в год в течение 8 лет. Данные о темпах роста населения показывают четкую, но нерегулярную циклическую тенденцию во времени.
Остатки от простой обобщенной линейной модели (скорость роста ~% заболевания +% паразитизм + год) демонстрировали аналогичную четкую, но нерегулярную циклическую тенденцию во времени. Следовательно, обобщенные модели наименьших квадратов той же формы также были адаптированы к данным с соответствующими корреляционными структурами, чтобы иметь дело с временной автокорреляцией, например, составной симметрией, авторегрессионным порядком обработки 1 и авторегрессионными корреляционными структурами скользящего среднего.
Все модели содержали одинаковые фиксированные эффекты, сравнивались с использованием AIC и устанавливались REML (чтобы позволить сравнение различных структур корреляции с помощью AIC). Я использую пакет R NLME и функцию GLS.
Вопрос 1
Остатки моделей GLS по-прежнему отображают практически идентичные циклические закономерности при построении графика в зависимости от времени. Будут ли такие шаблоны всегда оставаться, даже в моделях, которые точно учитывают автокорреляционную структуру?
Я смоделировал некоторые упрощенные, но похожие данные в R ниже моего второго вопроса, который показывает проблему, основанную на моем текущем понимании методов, необходимых для оценки временных автокоррелированных моделей в остатках модели , которые, как я теперь знаю, неверны (см. Ответ).
вопрос 2
Я приспособил модели GLS со всеми возможными вероятными структурами корреляции к моим данным, но на самом деле ни одна из них не является существенно более подходящей, чем GLM, без какой-либо структуры корреляции: только одна модель GLS незначительно лучше (оценка AIC = 1,8 ниже), в то время как все остальные имеют более высокие значения AIC. Тем не менее, это только тот случай, когда все модели соответствуют REML, а не ML, где модели GLS явно намного лучше, но я понимаю, что из книг статистики вы должны использовать REML только для сравнения моделей с различными структурами корреляции и одинаковыми фиксированными эффектами по причинам. Я не буду подробно здесь.
Учитывая явно временную автокорреляционную природу данных, если ни одна модель даже не в несколько раз лучше, чем простая GLM, какой самый подходящий способ решить, какую модель использовать для вывода, предполагая, что я использую соответствующий метод (я в конечном итоге хочу использовать AIC для сравнения различных переменных комбинаций)?
Q1 «симуляция», исследующая остаточные модели в моделях с соответствующими корреляционными структурами и без них
Создайте смоделированную переменную отклика с циклическим эффектом «время» и положительным линейным эффектом «х»:
time <- 1:50
x <- sample(rep(1:25,each=2),50)
y <- rnorm(50,5,5) + (5 + 15*sin(2*pi*time/25)) + (x/1)
у должен отображаться циклический тренд в течение «времени» со случайным изменением:
plot(time,y)
И положительные линейные отношения с «х» со случайным изменением:
plot(x,y)
Создайте простую линейную аддитивную модель "y ~ time + x":
require(nlme)
m1 <- gls(y ~ time + x, method="REML")
Модель отображает четкие циклические закономерности в остатках при построении в зависимости от «времени», как и следовало ожидать:
plot(time, m1$residuals)
И что должно быть приятным, ясным отсутствием какого-либо паттерна или тренда в остатках при построении против 'x':
plot(x, m1$residuals)
Простая модель "y ~ time + x", которая включает авторегрессивную корреляционную структуру порядка 1, должна соответствовать данным намного лучше, чем предыдущая модель, из-за автокорреляционной структуры, при оценке с использованием AIC:
m2 <- gls(y ~ time + x, correlation = corAR1(form=~time), method="REML")
AIC(m1,m2)
Однако модель должна по-прежнему отображать практически идентичные «временные» автокоррелированные остатки:
plot(time, m2$residuals)
Большое спасибо за любой совет.