Общая линейная модель позволяет нам написать модель ANOVA в качестве модели регрессии. Предположим, у нас есть две группы с двумя наблюдениями в каждой, то есть четыре наблюдения в векторе . Тогда исходная сверхпараметризованная модель имеет вид , где - матрица предикторов, т. Е. Фиктивные переменные индикатора:
E ( y ) = X ⋆ β ⋆ X ⋆ ( μ 1 μ 1 μ 2 μ 2 ) = ( 1 1 0 1 1 0 1 0 1 1 0 1 ) ( β ⋆ 0 β ⋆ 1 β ⋆ 2 )yE(y)=X⋆β⋆X⋆
⎛⎝⎜⎜⎜μ1μ1μ2μ2⎞⎠⎟⎟⎟=⎛⎝⎜⎜⎜111111000011⎞⎠⎟⎟⎟⎛⎝⎜β⋆0β⋆1β⋆2⎞⎠⎟
Параметры не могут быть идентифицированы как потому что имеет ранг 2 ( не является обратимым). Чтобы изменить это, мы вводим ограничение (контрасты лечения), что дает нам новую модель :
X ⋆ ( X ⋆ ) ′ X ⋆ β ⋆ 1 = 0 E ( y ) = X β ( μ 1 μ 1 μ 2 μ 2 ) = ( 1 0 1 0 1 1 1 1((X⋆)′X⋆)−1(X⋆)′E(y)X⋆(X⋆)′X⋆β⋆1=0E(y)=Xβ
⎛⎝⎜⎜⎜μ1μ1μ2μ2⎞⎠⎟⎟⎟=⎛⎝⎜⎜⎜11110011⎞⎠⎟⎟⎟(β0β2)
Итак, , т. принимает значение ожидаемого значения из нашей справочной категории (группа 1). , т. е. принимает значение различия для справочной категории. Поскольку с двумя группами есть только один параметр, связанный с групповым эффектом, нулевая гипотеза ANOVA (все параметры группового эффекта равны 0) совпадает с нулевой гипотезой регрессионного веса (параметр наклона равен 0).μ1=β0β0μ2=β0+β2β2μ2−μ1
-test в общей линейной модели проверяет линейную комбинацию параметров против гипотетического значения при нулевой гипотезы. Выбрав , мы можем проверить гипотезу, что (обычный тест для параметра наклона), то есть здесь , Оценщик: , где - это МНК оценки для параметров. Общий тест статистики для такого составляет:
tψ=∑cjβjψ0c=(0,1)′β2=0μ2−μ1=0ψ^=∑cjβ^jβ^=(X′X)−1X′yψ
t=ψ^−ψ0σ^c′(X′X)−1c−−−−−−−−−√
| | е | | 2 R п к ( Х ) = 2 ( Х ' х ) - 1 х ' = ( 0,5 0,5 0 0 - 0,5 - 0,5 0,5 0,5 ) β 0 = 0,5σ^2=∥e∥2/(n−Rank(X)) - объективная оценка дисперсии ошибок, где - сумма квадратов невязок. В случае двух групп , , и , таким образом , являются оценками и . С 1 в нашем случае, статистика теста становится такой:
∥e∥2Rank(X)=2(X′X)−1X′=(.5−.5.5−.50.50.5)β^0=0.5y1+0.5y2=M1β^2=−0.5y1−0.5y2+0.5y3+0.5y4=M2−M1c′(X′X)−1c
t=M2−M1−0σ^=M2−M1∥e∥2/(n−2)−−−−−−−−−−√
t есть -distributed с ДФ (здесь ). Когда квадрат , вы получаете , тестовая статистика из ANOVA -test для двух групп ( для между ними, для внутри групп) , которые следует за - распределение с 1 и df.tn−Rank(X)n−2tFbwFn-Rank(X)(M2−M1)2/1∥e∥2/(n−2)=SSb/dfbSSw/dfw=FFbwFn−Rank(X)
С более чем двумя группами гипотеза ANOVA (все равны 0, с ) относится к более чем одному параметру и не может быть выражена как линейная комбинация , поэтому тесты не эквивалентны , 1 ≤ j ψβj1≤jψ