Надеюсь, что это вопрос, который кто-то здесь может ответить для меня о природе разложения сумм квадратов из модели смешанных эффектов lmer
(из пакета lme4 R).
Прежде всего я должен сказать, что мне известно о противоречиях с использованием этого подхода, и на практике я бы с большей вероятностью использовал загрузочный LRT для сравнения моделей (как это было предложено Faraway, 2006). Тем не менее, я озадачен тем, как воспроизвести результаты, и поэтому для собственного здравомыслия я подумал, что я спрошу здесь.
По сути, я справляюсь с использованием моделей со смешанными эффектами, подходящих под lme4
пакет. Я знаю, что вы можете использовать anova()
команду, чтобы получить сводную информацию о последовательном тестировании фиксированных эффектов в модели. Насколько я знаю, именно это Faraway (2006) называет подходом «ожидаемых средних квадратов». Я хочу знать, как рассчитываются суммы квадратов?
Я знаю, что могу взять оценочные значения из конкретной модели (используя coef()
), предположить, что они являются фиксированными, а затем провести тесты, используя суммы квадратов невязок модели с интересующими факторами и без них. Это хорошо для модели, содержащей один внутрисубъектный фактор. Тем не менее, при реализации сплит-графика значение суммы квадратов, которое я получаю, эквивалентно значению, полученному с помощью R aov()
с соответствующим Error()
обозначением. Однако это не то же самое, что суммы квадратов, полученных anova()
командой на модельном объекте, несмотря на то, что F-отношения одинаковы.
Конечно, это имеет полный смысл, так как Error()
в смешанной модели нет необходимости в стратах. Однако это должно означать, что суммы квадратов как-то штрафуются в смешанной модели, чтобы обеспечить соответствующие F-отношения. Как это достигается? И как модель каким-то образом исправляет сумму квадратов между участками, но не исправляет сумму квадратов в пределах сюжета. Очевидно, что это то, что необходимо для классического сплит-графика ANOVA, который был достигнут путем назначения разных значений ошибок для разных эффектов, так как модель смешанного эффекта позволяет это сделать?
По сути, я хочу иметь возможность реплицировать результаты из anova()
команды, примененной к объекту модели lmer, самостоятельно, чтобы проверить результаты и мое понимание, однако в настоящее время я могу добиться этого для обычного внутрисубъектного дизайна, но не для разделения. дизайн сюжета, и я не могу понять, почему это так.
В качестве примера:
library(faraway)
library(lme4)
data(irrigation)
anova(lmer(yield ~ irrigation + variety + (1|field), data = irrigation))
Analysis of Variance Table
Df Sum Sq Mean Sq F value
irrigation 3 1.6605 0.5535 0.3882
variety 1 2.2500 2.2500 1.5782
summary(aov(yield ~ irrigation + variety + Error(field/irrigation), data = irrigation))
Error: field
Df Sum Sq Mean Sq F value Pr(>F)
irrigation 3 40.19 13.40 0.388 0.769
Residuals 4 138.03 34.51
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
variety 1 2.25 2.250 1.578 0.249
Residuals 7 9.98 1.426
Как видно выше, все F-соотношения согласны. Суммы квадратов для разнообразия также согласуются. Тем не менее, суммы квадратов для орошения не согласуются, однако, похоже, что объем производства лмера масштабируется. Так что же на самом деле делает команда anova ()?
mixed()
изafex
которой предлагает то , что вы хотите ( с помощьюmethod = "PB"
). И, как вы, очевидно, провели некоторое тестирование с игрушечными данными, было бы определенно полезно, если бы вы могли показать эти эквивалентности с данными и кодом (следовательно, нет +1).