Разница между тестом ANOVA и тестом Крускала-Уоллиса


20

Я изучаю R и экспериментирую с анализом отклонений. Я бегал как

kruskal.test(depVar ~ indepVar, data=df)

и

anova(lm(depVar ~ indepVar, data=dF))

Есть ли практическая разница между этими двумя тестами? Насколько я понимаю, они оба оценивают нулевую гипотезу о том, что популяции имеют одинаковое среднее значение.

Ответы:


28

Существуют различия в допущениях и гипотезах, которые проверяются.

ANOVA (и t-критерий) - это явно критерий равенства средних значений. Крускал-Уоллис (и Манн-Уитни) технически можно рассматривать как сравнение средних рангов .

Следовательно, с точки зрения исходных значений, Крускал-Уоллис является более общим, чем сравнение средних: он проверяет, будет ли вероятность того, что случайное наблюдение из каждой группы в равной степени будет выше или ниже случайного наблюдения из другой группы. Реальное количество данных, которое лежит в основе этого сравнения, не является ни разницей в средних значениях, ни разницей в медианах (в случае двух выборок), это фактически медиана всех парных различий - разницы Ходжеса-Лемана между выборками.

Однако, если вы решите сделать некоторые ограничительные предположения, то Крускал-Уоллис можно рассматривать как критерий равенства средств населения, а также квантилей (например, медиан) и, действительно, широкого спектра других мер. То есть, если вы предполагаете, что групповые распределения по нулевой гипотезе одинаковы и что при альтернативе единственным изменением является сдвиг распределения (так называемая « альтернатива смещения местоположения »), то это также тест равенство населения означает (и одновременно медианы, нижние квартили и т. д.).

[Если вы сделаете это предположение, вы можете получить оценки и интервалы для относительных сдвигов, как вы можете с ANOVA. Ну, также возможно получить интервалы без этого предположения, но их труднее интерпретировать.]

Если вы посмотрите на ответ здесь , особенно в конце, он обсуждает сравнение между t-тестом и Уилкоксоном-Манном-Уитни, которые (по крайней мере, при проведении двусторонних тестов) эквивалентны ANOVA и Kruskal-Wallis применяется для сравнения только два образца; это дает немного больше деталей, и большая часть этого обсуждения переносится на Крускал-Уоллис против ANOVA.

Не совсем понятно, что вы подразумеваете под практической разницей. Вы используете их в целом аналогичным образом. Когда применяются оба набора допущений, они, как правило, дают довольно похожие результаты, но в некоторых ситуациях они, безусловно, могут давать довольно разные p-значения.

Редактировать: Вот пример сходства вывода даже для небольших выборок - вот область совместного принятия для сдвигов местоположений между тремя группами (вторая и третья по сравнению с первой), выбранными из нормальных распределений (с небольшими размерами выборки) для определенного набора данных на уровне 5%:

Приемлемые регионы для определения местоположения различий в Крускал-Уоллис и Анова

Могут быть обнаружены многочисленные интересные особенности - в этом случае немного большая область приема для KW с его границей, состоящей из вертикальных, горизонтальных и диагональных отрезков прямых линий (нетрудно понять, почему). Эти два региона говорят нам очень похожие вещи о параметрах, представляющих интерес здесь.


2
+1. Я осмелился немного отредактировать его, чтобы добавить акцент там, где я считал это необходимым. Пожалуйста, посмотрите сейчас, согласны вы или нет.
ttnphns

@ttnphns спасибо за редактирование. Есть некоторые конкретные причины, по которым некоторые из вещей, которые вы изменили, были там, поэтому я могу отредактировать часть оригинала обратно. Однако, возможно, я должен прояснить, почему я написал это так, как раньше. Но сначала я хочу тщательно подумать о том, как лучше сохранить как можно больше ваших изменений.
Glen_b

4

Да, есть. anovaЯвляется параметрическим подходом , а kruskal.testне является параметрическим подходом. Так kruskal.testчто не нужно никаких предположений о распределении.
С практической точки зрения, когда ваши данные искажены, anovaэто не будет хорошим подходом для использования. Посмотрите на этот вопрос, например.


4
Я бы сказал, что ANOVA Крускала-Уоллиса делает смягченные предположения относительно распределений по сравнению с параметрическим ANOVA: наблюдения в каждой группе происходят из популяций с похожей формой . Гетероскедастичность или сильно искаженные распределения остаются такими же проблематичными, как и в традиционных тестах.
ЧЛ

2
Как же так, @chl? Ранги не изменяются при перекошении, а KW основывается на рангах. Чего мне не хватает?
Питер Флом - Восстановить Монику

6
@PeterFlom Тест KW предполагает, что выборочные совокупности имеют идентичную форму и дисперсию, хотя в большинстве случаев незначительное отклонение от этих допущений не повлияет на результаты. При соблюдении параметрических допущений, тест является таким же мощным, как односторонний ANOVA. Что касается статистики тестов на основе рангов, некоторые исследования предполагают, однако, что различные степени асимметрии могут увеличивать номинальную частоту ошибок типа I, см., Например, Fagerland and Sandvik (2009) или некоторые другие ссылки . 3/π
chl

@chl Гипотеза - это равенство распределений, поэтому предположение об идентичной форме связано только со степенью, не так ли? ЧАС0
Стефан Лоран

1
@ StéphaneLaurent Если формы не идентичны, это может привести к неверному выводу. посмотрите мой пример здесь
настой

3

Δвведите описание изображения здесь

(*)ЧАС0:{Δзнак равно0}ЧАС1:{Δ0}(*)ЧАС0ЧАС0)(*)ЧАС0:{распределения равны}

(*)Δ>0Δ

ИксYNзнак равно1000ЧАС0

set.seed(666)
n <- 1000
x <- rnorm(n)
y <- (2*rbinom(n,1,1/2)-1)*rnorm(n,3)
plot(density(x, from=min(y), to=max(y)))
lines(density(y), col="blue")

введите описание изображения здесь

> kruskal.test(list(x,y))

    Kruskal-Wallis rank sum test

data:  list(x, y)
Kruskal-Wallis chi-squared = 2.482, df = 1, p-value = 0.1152

Как я утверждал в начале, я не уверен насчет точной конструкции KW. Может быть, мой ответ более правильный для другого непараметрического теста (Манн-Уитни? ..), но подход должен быть похожим.


1
Kruskal-Wallis test is constructed in order to detect a difference between two distributions having the same shape and the same dispersionКак упоминалось в ответе Глена, в комментариях и во многих других местах на этом сайте, это правда, но это ограниченное понимание того, что делает тест. same shape/dispersionна самом деле не является внутренним, но является дополнительным предположением, которое используется в некоторых и не используется в других ситуациях.
ttnphns

PS Ваш второй пример не противоречит и не опровергает KW-тест. Н0 теста нет distributions are equal , так думать ошибочно. H0 состоит только в том, что две точки «сгущения гравитаций», как показано на рисунке, не отклоняются друг от друга.
ttnphns

ЧАС0

1
krusal.test()ЧАС0

1
Да. the equality of the location parameters of the distributionявляется правильной формулировкой (хотя «местоположение» не следует рассматривать как среднее значение или медиану, в общем случае). Если вы принимаете одинаковые формы, то, естественно, этот же H0 становится «идентичным распределением».
ttnphns

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.