Если вы выполняете односторонний анализ ANOVA для проверки существенной разницы между группами, то неявно вы сравниваете две вложенные модели (поэтому существует только один уровень вложенности, но он все еще остается вложенным).
Эти две модели:
- Yя жяJβ^0
Yя ж= β^0+ ϵя
Модель 1: значения моделируются с помощью оценочных средних групп.
βJ^
Yя= β^0+ β^J+ ϵя
Пример сравнения средних значений и эквивалентности с вложенными моделями: давайте возьмем длину чашелистика (см) из набора данных радужной оболочки (если мы используем все четыре переменные, мы фактически могли бы использовать LDA или MANOVA, как это сделал Фишер в 1936 году)
Наблюдаемые итоговые и групповые средние значения:
μт о т лμs е т о сμv е р ы я с о л о гμv я г гя п я с= 5,83= 5,01= 5,94= 6,59
Который находится в модельной форме:
модель 1: модель 2: Yя ж= 5,83 + ϵяYя ж= 5,01 + ⎡⎣⎢00,931,58⎤⎦⎥J+ ϵя
∑ ϵ2я= 102,1683
∑ ϵ2я= 38,9562
И таблица ANOVA будет похожа (и неявно вычислит разницу, которая является суммой квадратов между группами, которая равна 63.212 в таблице с 2 степенями свободы):
> model1 <- lm(Sepal.Length ~ 1 + Species, data=iris)
> model0 <- lm(Sepal.Length ~ 1, data=iris)
> anova(model0, model1)
Analysis of Variance Table
Model 1: Sepal.Length ~ 1
Model 2: Sepal.Length ~ 1 + Species
Res.Df RSS Df Sum of Sq F Pr(>F)
1 149 102.168
2 147 38.956 2 63.212 119.26 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
F= R SSdя феe r e n c eD Fdя феe r e n c eR SSn e wD Fn e w= 63,212238,956147= 119,26
Набор данных, использованный в примере:
Длина лепестка (см) для трех разных видов ирисов
Iris setosa Iris versicolor Iris virginica
5.1 7.0 6.3
4.9 6.4 5.8
4.7 6.9 7.1
4.6 5.5 6.3
5.0 6.5 6.5
5.4 5.7 7.6
4.6 6.3 4.9
5.0 4.9 7.3
4.4 6.6 6.7
4.9 5.2 7.2
5.4 5.0 6.5
4.8 5.9 6.4
4.8 6.0 6.8
4.3 6.1 5.7
5.8 5.6 5.8
5.7 6.7 6.4
5.4 5.6 6.5
5.1 5.8 7.7
5.7 6.2 7.7
5.1 5.6 6.0
5.4 5.9 6.9
5.1 6.1 5.6
4.6 6.3 7.7
5.1 6.1 6.3
4.8 6.4 6.7
5.0 6.6 7.2
5.0 6.8 6.2
5.2 6.7 6.1
5.2 6.0 6.4
4.7 5.7 7.2
4.8 5.5 7.4
5.4 5.5 7.9
5.2 5.8 6.4
5.5 6.0 6.3
4.9 5.4 6.1
5.0 6.0 7.7
5.5 6.7 6.3
4.9 6.3 6.4
4.4 5.6 6.0
5.1 5.5 6.9
5.0 5.5 6.7
4.5 6.1 6.9
4.4 5.8 5.8
5.0 5.0 6.8
5.1 5.6 6.7
4.8 5.7 6.7
5.1 5.7 6.3
4.6 6.2 6.5
5.3 5.1 6.2
5.0 5.7 5.9
anova()
функция, потому что первая, реальная, ANOVA также использует F-тест. Это приводит к путанице в терминологии.