Я имею в виду любую причину, кроме удобства возможности проведения анализа в рамках одной процедуры.
Я имею в виду любую причину, кроме удобства возможности проведения анализа в рамках одной процедуры.
Ответы:
Да, по нескольким причинам!
1) Парадокс Симпсонов . Если дизайн не сбалансирован, и если одна из переменных влияет на результат, вы не сможете должным образом оценить даже направление эффекта другой без корректировки на первую (см., В частности, первую диаграмму по ссылке - воспроизведено ниже). **). Это иллюстрирует проблему - эффект внутри группы увеличивается (две цветные линии), но если вы игнорируете красно-синюю группировку, вы получаете эффект уменьшения (пунктирная, серая линия) - совершенно неправильный знак!
Хотя это показывает ситуацию с одной непрерывной и одной групповой переменной, подобные вещи могут происходить, когда несбалансированные двусторонние основные эффекты ANOVA рассматриваются как две односторонние модели.
2) Давайте предположим, что есть полностью сбалансированный дизайн. Тогда вы все равно захотите это сделать, потому что, если вы игнорируете вторую переменную, глядя на первую (предполагая, что обе имеют какое-то влияние), то эффект второй переходит в шумовой коэффициент , раздувая его ... и, таким образом, смещая все ваши стандартные ошибки наверх. В этом случае значительные - и важные - эффекты могут выглядеть как шум.
Рассмотрим следующие данные, непрерывный ответ и два номинальных категориальных фактора:
y x1 x2
1 2.33 A 1
2 1.90 B 1
3 4.77 C 1
4 3.48 A 2
5 1.34 B 2
6 4.16 C 2
7 5.88 A 3
8 2.56 B 3
9 5.97 C 3
10 5.10 A 4
11 2.62 B 4
12 6.21 C 4
13 6.54 A 5
14 6.01 B 5
15 9.62 C 5
Двухсторонний основной эффект anova очень важен (поскольку он сбалансирован, порядок не имеет значения):
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x1 2 26.644 13.3220 24.284 0.0004000
x2 4 38.889 9.7222 17.722 0.0004859
Residuals 8 4.389 0.5486
Но отдельные односторонние ановы незначимы на уровне 5%:
(1) Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x1 2 26.687 13.3436 3.6967 0.05613
Residuals 12 43.315 3.6096
(2) Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x2 4 38.889 9.7222 3.1329 0.06511
Residuals 10 31.033 3.1033
Обратите внимание, что в каждом случае среднеквадратичное значение для этого фактора не изменилось ... но остаточные среднеквадратичные значения резко возросли (с 0,55 до более 3 в каждом случае). Это эффект пропуска важной переменной.
** (приведенная выше диаграмма была сделана пользователем из Википедии Шутцем , но размещена в открытом доступе; хотя для элементов в открытом доступе указание авторства не требуется, я считаю, что это заслуживает признания)
Да. Если две независимые переменные связаны и / или ANOVA не сбалансирован, то двухсторонний ANOVA показывает влияние каждой переменной, контролирующей другую.