На что это указывает, когда корреляция Спирмена на определенную величину меньше Пирсона?


12

У меня есть куча связанных наборов данных. Корреляции Пирсона между их парами обычно определенно больше, чем корреляции Спирмена. Это говорит о том, что любая корреляция является линейной, но можно ожидать, что даже если бы Пирсон и Спирмен были одинаковыми. Что это означает, когда существует определенный разрыв между корреляцией Пирсона и Спирмена, а Пирсон больше? Кажется, это постоянная функция в моих наборах данных.


Очень похожий вопрос с отличным ответом здесь
Colin T Bowers

Ответы:


14

Корреляция Спирмена - это просто корреляция Пирсона, использующая ранги (статистику заказов) вместо фактических числовых значений. Ответ на ваш вопрос заключается в том, что они не измеряют одно и то же. Пирсон: линейный тренд, Спирмен: монотонный тренд. То, что корреляция Пирсона выше, означает, что линейная корреляция больше, чем ранговая корреляция. Вероятно, это связано с влиятельными наблюдениями в хвостах распределения, которые имеют большое влияние относительно их ранжированных значений. Тесты ассоциации, использующие корреляцию Пирсона, имеют большую мощность, когда линейность сохраняется в данных.


1
Я знал, что копейщик был просто жемчугом в строю. Мне нужно посмотреть, могут ли быть какие-то другие маршруты, которые могли бы вызвать это также, но влиятельные хвостовые наблюдения, которые имеют более линейную корреляцию, чем объем данных, но которые теряют свое влияние при замене их ранжированием, определенно вызвали бы то, чем я являюсь. видя.
Джон Робертсон

0

Корреляция Пирсона предполагает несколько допущений для ее точности: 1) каждая переменная обычно распределена; 2) гомоскедастичность, дисперсия каждой переменной остается постоянной; и 3) Линейность, означающая, что график рассеяния, изображающий взаимосвязь, показывает точки данных, сгруппированные симметрично вокруг линии регрессии.

Корреляция Спирмена - непараметрическая альтернатива Пирсону, основанная на ранге наблюдений. Корреляция Спирмена позволяет вам ослабить все три предположения о вашем наборе данных и получить корреляции, которые все еще достаточно точны.

Ваши данные подразумевают, что они, вероятно, существенно нарушают одно или несколько из упомянутых допущений, так что две корреляции значительно различаются.

Учитывая, что у вас большой разрыв между двумя корреляциями, вы должны исследовать, являются ли переменные вашего набора данных нормально распределенными, гомоскедастичными и линейными в точечной диаграмме.

Приведенное выше исследование поможет вам принять решение о том, является ли коэффициент корреляции Спирмена или Пирсона более представительным.


2
t

4
Неправильно. Вывод о корреляции Пирсона не требует выполнения каких-либо из этих предположений. Можно иметь криволинейные отношения с гетероскедастическими, ненормальными данными, и тест корреляции Пирсона (который эквивалентен выводу на модели линейной регрессии) способен обнаружить тренд первого порядка. Интерпретация корреляции Пирсона как силы тренда первого порядка сохраняется. Есть несколько обстоятельств, когда тренд первого порядка, измеренный корреляцией Пирсона, не подходит для анализа.
AdamO
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.