Мой основной вопрос заключается в том, как интерпретировать выходные данные (коэффициенты, F, P) при проведении ANOVA типа I (последовательного)?
Моя конкретная исследовательская проблема немного сложнее, поэтому я разобью свой пример на части. Во-первых, если меня интересует влияние плотности пауков (X1), скажем, на рост растений (Y1) и я сажал саженцы в вольерах и манипулировал плотностью пауков, то я могу проанализировать данные с помощью простой ANOVA или линейной регрессии. Тогда не имеет значения, если бы я использовал тип I, II или III сумму квадратов (SS) для моей ANOVA. В моем случае у меня есть 4 копии 5 уровней плотности, поэтому я могу использовать плотность как фактор или как непрерывную переменную. В этом случае я предпочитаю интерпретировать его как непрерывную независимую (предикторную) переменную. В РИ может работать следующее:
lm1 <- lm(y1 ~ density, data = Ena)
summary(lm1)
anova(lm1)
Мы надеемся, что запуск функции anova будет иметь смысл для последующего сравнения, поэтому, пожалуйста, не обращайте на это внимания. Выход:
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4279 0.08058 .
Residuals 18 2.53920 0.14107
Теперь, допустим, я подозреваю, что начальный уровень неорганического азота в почве, который я не мог контролировать, также мог существенно повлиять на рост растений. Я не особенно заинтересован в этом эффекте, но хотел бы потенциально объяснить изменение, которое это вызывает. На самом деле, мой основной интерес - влияние плотности пауков (гипотеза: увеличение плотности пауков приводит к увеличению роста растений - предположительно за счет сокращения травоядных насекомых, но я только проверяю эффект, а не механизм). Я мог бы добавить эффект неорганического N к моему анализу.
Ради моего вопроса, давайте представим, что я тестирую плотность взаимодействия * inorganicN, и она незначительна, поэтому я удаляю ее из анализа и запускаю следующие основные эффекты:
> lm2 <- lm(y1 ~ density + inorganicN, data = Ena)
> anova(lm2)
Analysis of Variance Table
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4113 0.08223 .
inorganicN 1 0.12936 0.12936 0.9126 0.35282
Residuals 17 2.40983 0.14175
Теперь, имеет значение, использую ли я Тип I или Тип II SS (я знаю, что некоторые люди возражают против терминов Тип I и II и т. Д., Но, учитывая популярность SAS, это легко сократить). R anova {stats} использует тип I по умолчанию. Я могу рассчитать SS, F и P типа II для плотности, поменяв местами порядок моих основных эффектов, или я могу использовать пакет «машины» доктора Джона Фокса (в дополнение к прикладной регрессии). Я предпочитаю последний метод, так как он легче для более сложных задач.
library(car)
Anova(lm2)
Sum Sq Df F value Pr(>F)
density 0.58425 1 4.1216 0.05829 .
inorganicN 0.12936 1 0.9126 0.35282
Residuals 2.40983 17
Насколько я понимаю, гипотезы типа II были бы такими: «Не существует линейного влияния x1 на y1, учитывая эффект (удерживая постоянным?) X2», и то же самое для x2, заданного x1. Я думаю, это то, где я запутался. Какую гипотезу проверяет ANOVA с использованием метода I (последовательного) типа выше, по сравнению с гипотезой, использующей метод II типа?
На самом деле мои данные немного сложнее, потому что я измерил многочисленные показатели роста растений, а также динамику питательных веществ и разложение подстилки. Мой фактический анализ что-то вроде:
Y <- cbind(y1 + y2 + y3 + y4 + y5)
# Type II
mlm1 <- lm(Y ~ density + nitrate + Npred, data = Ena)
Manova(mlm1)
Type II MANOVA Tests: Pillai test statistic
Df test stat approx F num Df den Df Pr(>F)
density 1 0.34397 1 5 12 0.34269
nitrate 1 0.99994 40337 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
# Type I
maov1 <- manova(Y ~ density + nitrate + Npred, data = Ena)
summary(maov1)
Df Pillai approx F num Df den Df Pr(>F)
density 1 0.99950 4762 5 12 < 2e-16 ***
nitrate 1 0.99995 46248 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
Residuals 16