Предположим следующую ситуацию:
у нас есть большое количество (например, 20) с небольшим размером группы (например, n = 3). Я заметил, что если я сгенерирую значения из равномерного распределения, остатки будут выглядеть примерно нормально, даже если распределение ошибок будет равномерным. Следующий код R демонстрирует это поведение:
n.group = 200
n.per.group = 3
x <- runif(n.group * n.per.group)
gr <- as.factor(rep(1:n.group, each = n.per.group))
means <- tapply(x, gr, mean)
x.res <- x - means[gr]
hist(x.res)
Если я посмотрю на остаток выборки в группе из трех, причина поведения ясна:
Поскольку является суммой случайных величин с примерно не отличающимся стандартным отклонением, его распределение немного ближе к нормальному распределению, чем отдельные члены.
Теперь предположим, что у меня такая же ситуация с реальными данными вместо симулированных данных. Я хочу оценить, соответствуют ли предположения ANOVA нормальности. В большинстве рекомендуемых процедур рекомендуется визуальный осмотр остатков (например, QQ-Plot) или проверка нормальности остатков. Как мой пример выше, это не совсем оптимально для небольших групп.
Есть ли лучшая альтернатива, когда у меня много групп небольших размеров?