Если меня не интересует взаимодействие, есть ли какая-либо причина использовать двухсторонний ANOVA вместо двух односторонних ANOVA?

9

Я имею в виду любую причину, кроме удобства возможности проведения анализа в рамках одной процедуры.

anova

— user1205901 - Восстановить Монику
источник

1

Вот в чем дело: если есть взаимодействие, то не имеет смысла «не интересоваться им», потому что вы не можете осмысленно интерпретировать основные эффекты в одиночку, если есть взаимодействие. Поэтому, в дополнение к ответу ниже, я призываю вас пересмотреть то, что вы делаете.

— Эрик

19

Да, по нескольким причинам!

1) Парадокс Симпсонов . Если дизайн не сбалансирован, и если одна из переменных влияет на результат, вы не сможете должным образом оценить даже направление эффекта другой без корректировки на первую (см., В частности, первую диаграмму по ссылке - воспроизведено ниже). **). Это иллюстрирует проблему - эффект внутри группы увеличивается (две цветные линии), но если вы игнорируете красно-синюю группировку, вы получаете эффект уменьшения (пунктирная, серая линия) - совершенно неправильный знак!

введите описание изображения здесь

Хотя это показывает ситуацию с одной непрерывной и одной групповой переменной, подобные вещи могут происходить, когда несбалансированные двусторонние основные эффекты ANOVA рассматриваются как две односторонние модели.

2) Давайте предположим, что есть полностью сбалансированный дизайн. Тогда вы все равно захотите это сделать, потому что, если вы игнорируете вторую переменную, глядя на первую (предполагая, что обе имеют какое-то влияние), то эффект второй переходит в шумовой коэффициент , раздувая его ... и, таким образом, смещая все ваши стандартные ошибки наверх. В этом случае значительные - и важные - эффекты могут выглядеть как шум.

Рассмотрим следующие данные, непрерывный ответ и два номинальных категориальных фактора:

      y x1 x2
1  2.33  A  1
2  1.90  B  1
3  4.77  C  1
4  3.48  A  2
5  1.34  B  2
6  4.16  C  2
7  5.88  A  3
8  2.56  B  3
9  5.97  C  3
10 5.10  A  4
11 2.62  B  4
12 6.21  C  4
13 6.54  A  5
14 6.01  B  5
15 9.62  C  5

Двухсторонний основной эффект anova очень важен (поскольку он сбалансирован, порядок не имеет значения):

Analysis of Variance Table
Response: y
          Df Sum Sq Mean Sq F value    Pr(>F)    
x1         2 26.644 13.3220  24.284 0.0004000 
x2         4 38.889  9.7222  17.722 0.0004859 
Residuals  8  4.389  0.5486

Но отдельные односторонние ановы незначимы на уровне 5%:

(1) Analysis of Variance Table
Response: y
          Df Sum Sq Mean Sq F value  Pr(>F)  
x1         2 26.687 13.3436  3.6967 0.05613 
Residuals 12 43.315  3.6096                  

(2) Analysis of Variance Table
Response: y
          Df Sum Sq Mean Sq F value  Pr(>F)  
x2         4 38.889  9.7222  3.1329 0.06511 
Residuals 10 31.033  3.1033

Обратите внимание, что в каждом случае среднеквадратичное значение для этого фактора не изменилось ... но остаточные среднеквадратичные значения резко возросли (с 0,55 до более 3 в каждом случае). Это эффект пропуска важной переменной.

** ^{(приведенная выше диаграмма была сделана пользователем из Википедии Шутцем , но размещена в открытом доступе; хотя для элементов в открытом доступе указание авторства не требуется, я считаю, что это заслуживает признания)}

— Glen_b - Восстановить Монику
источник

6

Да. Если две независимые переменные связаны и / или ANOVA не сбалансирован, то двухсторонний ANOVA показывает влияние каждой переменной, контролирующей другую.

— Питер Флом
источник