Меня смущает предположение о нормальности при повторных измерениях ANOVA. В частности, мне интересно, какие именно нормы должны быть соблюдены. Читая литературу и ответы на резюме, я натолкнулся на три разные формулировки этого предположения.
Зависимая переменная внутри каждого (повторного) условия должна распределяться нормально.
Часто утверждается, что у RANOVA те же предположения, что и у ANOVA, плюс сферичность. Это требование в статистике Обнаружения Филда, а также в статье Википедии на эту тему и в тексте Лоури .
Остатки (различия между всеми возможными парами?) Должны распределяться нормально.
Я нашел это утверждение в нескольких ответах на резюме ( 1 , 2 ). По аналогии rANOVA с парным t-тестом это также может показаться интуитивным.
Многомерная нормальность должна быть удовлетворена.
Википедия и этот источник упоминают об этом. Кроме того, я знаю, что RANOVA можно поменять местами с MANOVA, что может оправдать это требование.
Это как-то эквивалентно? Я знаю, что многомерная нормальность означает, что любая линейная комбинация DV нормально распределена, поэтому 3. естественно будет включать 2., если я правильно понимаю последнее.
Если это не одно и то же, каково «истинное» предположение о RANOVA? Можете ли вы предоставить ссылку?
Мне кажется, что наибольшая поддержка первой претензии. Однако это не соответствует ответам, которые обычно приводятся здесь.
Линейные смешанные модели
Благодаря подсказке @ utobi я теперь понимаю, как можно переформулировать rANOVA как линейную смешанную модель. В частности, чтобы смоделировать, как артериальное давление изменяется со временем, я бы смоделировал ожидаемое значение как: где y i j - измерения артериального давления, a i - средняя кровь давление i-го субъекта и t i j как j-й раз, когда i-й субъект был измерен, b i
Наконец, я попытался подумать о том, что это значит для нормальности, но без особого успеха. Перефразируя МакКаллока и Сирла (2001, стр. 35. Уравнение (2.14)):
Я понимаю, что это означает, что
4. Данные каждого человека должны быть нормально распределены, но это нецелесообразно для тестирования с несколькими временными точками.
Я принимаю третье выражение, чтобы означать, что
5. средние показатели по отдельным предметам обычно распределяются. Обратите внимание, что это еще две отличные возможности в дополнение к трем, упомянутым выше.
McCulloch, CE & Searle, SR (2001). Обобщенные, линейные и смешанные модели . Нью-Йорк: John Wiley & Sons, Inc.