Как и другие параметрические тесты, анализ отклонений предполагает, что данные соответствуют нормальному распределению. Если ваша переменная измерения обычно не распределена, вы можете увеличить свой шанс ложного положительного результата, если вы проанализируете данные с помощью ановы или другого теста, который предполагает нормальность. К счастью, анова не очень чувствительна к умеренным отклонениям от нормы; Имитационные исследования с использованием различных ненормальных распределений показали, что это ложное положительное влияние на уровень ложноположительных результатов не сильно влияет (Glass et al. 1972, Harwell et al. 1992, Lix et al. 1996). Это связано с тем, что когда вы берете большое количество случайных выборок из совокупности, средние значения этих выборок приблизительно нормально распределяются, даже если совокупность не является нормальной.
Можно проверить соответствие набора данных нормальному распределению. Я не советую вам делать это, потому что многие наборы данных, которые являются значительно ненормальными, будут идеально подходить для ановы.
Вместо этого, если у вас достаточно большой набор данных, я предлагаю вам взглянуть на частотную гистограмму. Если это выглядит более-менее нормально, сделайте анову. Если это выглядит как нормальное распределение, которое было перенесено в одну сторону, как, например, сульфатные данные выше, вы должны попробовать различные преобразования данных и посмотреть, не сделает ли какое-либо из них гистограмму более нормальной. Если это не сработает, и данные по-прежнему выглядят совершенно ненормальными, вероятно, все еще можно анализировать данные с использованием anova. Однако вы можете проанализировать его с помощью непараметрического теста. Почти в каждом параметрическом статистическом тесте есть непараметрический заменитель, такой как критерий Крускала-Уоллиса вместо односторонней ановы, тест рангового ранга Уилкоксона вместо парного t-теста и ранговая корреляция Спирмена вместо линейной регрессии. Эти непараметрические тесты не предполагают, что данные соответствуют нормальному распределению. Однако они предполагают, что данные в разных группах имеют одинаковое распределение; если разные группы имеют разные формы распределения (например, одна перекошена влево, другая перекошена вправо), непараметрический критерий может быть не лучше параметрического.
Ссылки
- Гласс Г.В., П.Д. Пекхэм и Дж.Р. Сандерс. 1972. Последствия несоблюдения допущений, лежащих в основе анализа постоянных эффектов дисперсии и ковариации. Преподобный Местожительство 42: 237-288.
- Harwell, MR, EN Rubinstein, WS Hayes и CC Olds. 1992. Подведение итогов Монте-Карло приводит к методологическим исследованиям: однофакторные и двухфакторные фиксированные эффекты, случаи ANOVA. J. Educ. Стат. 17: 315-339.
- Lix, LM, JC Keselman и HJ Keselman. 1996. Последствия нарушений допущений: количественный обзор альтернатив одностороннему анализу дисперсионного F-критерия. Преподобный Местожительство 66: 579-619.