Как интерпретировать ANOVA и MANOVA типа I, типа II и типа III?


45

Мой основной вопрос заключается в том, как интерпретировать выходные данные (коэффициенты, F, P) при проведении ANOVA типа I (последовательного)?

Моя конкретная исследовательская проблема немного сложнее, поэтому я разобью свой пример на части. Во-первых, если меня интересует влияние плотности пауков (X1), скажем, на рост растений (Y1) и я сажал саженцы в вольерах и манипулировал плотностью пауков, то я могу проанализировать данные с помощью простой ANOVA или линейной регрессии. Тогда не имеет значения, если бы я использовал тип I, II или III сумму квадратов (SS) для моей ANOVA. В моем случае у меня есть 4 копии 5 уровней плотности, поэтому я могу использовать плотность как фактор или как непрерывную переменную. В этом случае я предпочитаю интерпретировать его как непрерывную независимую (предикторную) переменную. В РИ может работать следующее:

lm1 <- lm(y1 ~ density, data = Ena)
summary(lm1)
anova(lm1)

Мы надеемся, что запуск функции anova будет иметь смысл для последующего сравнения, поэтому, пожалуйста, не обращайте на это внимания. Выход:

Response: y1
          Df  Sum Sq Mean Sq F value  Pr(>F)  
density    1 0.48357 0.48357  3.4279 0.08058 .
Residuals 18 2.53920 0.14107 

Теперь, допустим, я подозреваю, что начальный уровень неорганического азота в почве, который я не мог контролировать, также мог существенно повлиять на рост растений. Я не особенно заинтересован в этом эффекте, но хотел бы потенциально объяснить изменение, которое это вызывает. На самом деле, мой основной интерес - влияние плотности пауков (гипотеза: увеличение плотности пауков приводит к увеличению роста растений - предположительно за счет сокращения травоядных насекомых, но я только проверяю эффект, а не механизм). Я мог бы добавить эффект неорганического N к моему анализу.

Ради моего вопроса, давайте представим, что я тестирую плотность взаимодействия * inorganicN, и она незначительна, поэтому я удаляю ее из анализа и запускаю следующие основные эффекты:

> lm2 <- lm(y1 ~ density + inorganicN, data = Ena)
> anova(lm2)
Analysis of Variance Table

Response: y1
           Df  Sum Sq Mean Sq F value  Pr(>F)  
density     1 0.48357 0.48357  3.4113 0.08223 .
inorganicN  1 0.12936 0.12936  0.9126 0.35282  
Residuals  17 2.40983 0.14175 

Теперь, имеет значение, использую ли я Тип I или Тип II SS (я знаю, что некоторые люди возражают против терминов Тип I и II и т. Д., Но, учитывая популярность SAS, это легко сократить). R anova {stats} использует тип I по умолчанию. Я могу рассчитать SS, F и P типа II для плотности, поменяв местами порядок моих основных эффектов, или я могу использовать пакет «машины» доктора Джона Фокса (в дополнение к прикладной регрессии). Я предпочитаю последний метод, так как он легче для более сложных задач.

library(car)
Anova(lm2)
            Sum Sq Df F value  Pr(>F)  
density    0.58425  1  4.1216 0.05829 .
inorganicN 0.12936  1  0.9126 0.35282  
Residuals  2.40983 17  

Насколько я понимаю, гипотезы типа II были бы такими: «Не существует линейного влияния x1 на y1, учитывая эффект (удерживая постоянным?) X2», и то же самое для x2, заданного x1. Я думаю, это то, где я запутался. Какую гипотезу проверяет ANOVA с использованием метода I (последовательного) типа выше, по сравнению с гипотезой, использующей метод II типа?

На самом деле мои данные немного сложнее, потому что я измерил многочисленные показатели роста растений, а также динамику питательных веществ и разложение подстилки. Мой фактический анализ что-то вроде:

Y <- cbind(y1 + y2 + y3 + y4 + y5)
# Type II
mlm1 <- lm(Y ~ density + nitrate + Npred, data = Ena)
Manova(mlm1)

Type II MANOVA Tests: Pillai test statistic
        Df test stat approx F num Df den Df  Pr(>F)    
density  1   0.34397        1      5     12 0.34269    
nitrate  1   0.99994    40337      5     12 < 2e-16 ***
Npred    1   0.65582        5      5     12 0.01445 * 


# Type I
maov1 <- manova(Y ~ density + nitrate + Npred, data = Ena)
summary(maov1)

          Df  Pillai approx F num Df den Df  Pr(>F)    
density    1 0.99950     4762      5     12 < 2e-16 ***
nitrate    1 0.99995    46248      5     12 < 2e-16 ***
Npred      1 0.65582        5      5     12 0.01445 *  
Residuals 16                                           

Ответы:


71

NN11N12N21N22рзнак равно0,1рявляется «значительным», это все население, которое вас волнует). Проблема, связанная с корреляцией ваших факторов, заключается в том, что существуют суммы квадратов, которые связаны как с А, так и с B. При вычислении ANOVA (или любой другой линейной регрессии) мы хотим разделить суммы квадратов. Разделение помещает все суммы квадратов в один и только одиниз нескольких подмножеств. (Например, мы могли бы хотеть разделить SS на A, B и ошибку.) Однако, поскольку ваши факторы (все еще только A и B здесь) не ортогональны, нет уникального разделения этих SS. На самом деле, может быть очень много разделов, и если вы хотите разделить свой SS на фракции (например, «Я положу .5 в этот контейнер и .5 в этот»), то существует бесконечное количество разделов. Способ визуализировать это состоит в том, чтобы представить символ MasterCard: прямоугольник представляет общую СС, а каждый из кругов представляет СС, которые относятся к этому фактору, но обратите внимание на перекрытие между кругами в центре, эти СС могут быть заданы в любой круг.

введите описание изображения здесь

Вопрос в том, как нам выбрать «правильный» раздел из всех этих возможностей? Давайте вернем взаимодействие и обсудим некоторые возможности:

Тип I СС:

  • СС (А)
  • С. С. (В | А)
  • SS (A * B | A, B)

Тип II СС:

  • СС (А | В)
  • С. С. (В | А)
  • SS (A * B | A, B)

Тип III СС:

  • SS (A | B, A * B)
  • SS (B | A, A * B)
  • SS (A * B | A, B)

Обратите внимание, как работают эти разные возможности. Только SS типа I фактически использует эти SS в перекрывающейся части между кругами в символе MasterCard. То есть, СС , которые можно было бы отнести к А или В, которые на самом деле отнести к одному из них , когда вы используете тип I SS ( в частности, один вы вошли в модель первого). В двух других подходов, то перекрывающихся SS не используются вообще . Таким образом, SS типа I отдает A все SS, относящиеся к A (включая те, которые также могли быть приписаны в другом месте), затем передает B все оставшиеся SS, которые относятся к B, затем передает взаимодействию A * B все из оставшихсяSS, которые относятся к A * B, и оставляют остатки, которые ни к чему не могут быть отнесены к термину ошибки.

SS типа III дает A только те SS, которые однозначно связаны с A, также он дает только B и взаимодействию те SS, которые однозначно связаны с ними. Термин ошибки получает только те СС, которые нельзя отнести ни к одному из факторов. Таким образом, те «неоднозначные» СС, которые можно отнести к двум или более возможностям, не используются. Если вы суммируете SS типа III в таблице ANOVA, вы заметите, что они не равны общему SS. Другими словами, этот анализ должен быть неправильным, но ошибается в некотором эпистемологически консервативном ключе. Многие статистики считают этот подход вопиющим, однако государственные финансирующие агентства (я считаю, FDA) требуют их использования.

Подход типа II предназначен для того, чтобы отразить то, что может иметь смысл в идее, лежащей в основе типа III, но смягчить ее излишки. В частности, он только настраивает SS для A и B друг для друга, а не взаимодействие. Однако на практике SS типа II практически никогда не используется. Вам нужно было бы знать обо всем этом и быть достаточно опытным с вашим программным обеспечением, чтобы получить эти оценки, и аналитики, которые обычно думают, что это чушь.

Есть еще виды СС (я считаю, IV и V). В конце 60-х им предложили разобраться с определенными ситуациями, но позже было показано, что они не делают того, о чем думали. Таким образом, на данный момент они просто историческая сноска.

Что касается вопросов, на которые они отвечают, вы в основном имеете это право уже в своем вопросе:

  • Оценки, использующие SS типа I, говорят вам, сколько из изменчивости в Y может быть объяснено A, сколько из остаточной изменчивости может быть объяснено B, сколько из остаточной изменчивости может быть объяснено взаимодействием, и так далее, в порядке .
  • Оценки, основанные на SS типа III, говорят вам, сколько остаточной изменчивости в Y может быть учтено A после учета всего остального, и сколько остаточной изменчивости в Y может быть учтено B после того, как учтено все остальное ну и так далее. (Обратите внимание, что оба идут и первым, и последним одновременно; если это имеет смысл для вас и точно отражает ваш вопрос исследования, используйте SS типа III.)

2
спасибо за очень полезный ответ. Еще одна область, в которой я запутался, заключается в том, что, если «Оценки с использованием SS типа I сообщают вам, какая из вариабельности в Y может быть объяснена A, какая из остаточной изменчивости может быть объяснена B, сколько из оставшейся остаточной изменчивость может быть объяснена взаимодействием и т. д. по порядку: «Тогда почему статистика, связанная с А, изменяется при добавлении дополнительных переменных? Это потому, что тесты основаны на SS (A) / SS (ошибка), а ошибка является функцией всех членов модели? Я правильно об этом думаю?
djhocking

1
Под «статистикой, связанной с A» я понимаю, что вы подразумеваете значения F и p для основного эффекта A. Значение F для A - это отношение среднего квадрата для A (то есть SSA / dfA) к MS ошибка. Когда вы добавляете больше факторов, SS берутся из условия ошибки и присваиваются этим факторам. В общем, это означает, что ошибка MS уменьшается, и, следовательно, отношение увеличивается. В результате значение F для A становится больше, а значение p уменьшается. Поскольку степени свободы также изменяются, это может быть более сложным, чем это, но это суть этого.
gung - Восстановить Монику

К сожалению, я имел в виду MS (A) / MSE для F-статистики. В любом случае, ваш ответ идеален, еще раз спасибо за вашу помощь!
djhocking

Мне любопытно узнать подробности интерпретации при использовании типа I. В моем случае плотность является моей единственной переменной, представляющей интерес, и единственной, которой я экспериментально манипулировал. Как ни прискорбно, плотность незначительна сама по себе или после учета двух других моих представляющих интерес переменных (Npredators, неорганическиеN в типе II или III). Но поскольку неорганический N, по-видимому, объясняет большую часть различий в некоторых зависимых переменных, когда я добавляю его как третью переменную, это делает две другие очень значимыми. Следовательно, действительно ли плотность оказывает существенное влияние на Y? Это разумно?
Джоккинг

2
@JonBonJovi, аналогия с MasterCard имеет только 2 фактора. Если вам нужно 2 фактора плюс взаимодействие, то вам понадобятся 3 области, которые несколько перекрывают друг друга. Конечно, можно нарисовать диаграмму Эйлера с 3 областями, но я просто использовал символ MasterCard для простоты. Для взаимодействия представьте 3-й круг, который перекрывает первые 2 (например, он может быть центрирован справа налево, но в основном над остальными); тогда весь круг A (SS) перейдет к A, все в B, которое не перекрывает A, перейдет к B, и все в A B, которое не будет перекрываться *, либо A, либо B перейдут к взаимодействию.
gung - Восстановить Монику
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.