когда я запускал несколько примеров, значения p для rho и t-критерия корреляции рангов Пирсона всегда совпадали, за исключением последних нескольких цифр
Ну, тогда вы использовали неправильные примеры!
a = c(1,2,3,4,5,6,7,8,9)
b = c(1,2,3,4,5,6,7,8,90)
cor.test(a,b,method='pearson')
Pearson's product-moment correlation
data: a and b
t = 2.0528, df = 7, p-value = 0.0792
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.08621009 0.90762506
sample estimates:
cor
0.6130088
cor.test(a,b,method='spearman')
Spearman's rank correlation rho
data: a and b
S = 0, p-value = 5.511e-06
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
1
a
b
ρb
И наоборот, хотя a
и b
имеют идеальную ранговую корреляцию, их коэффициент корреляции Пирсона меньше 1. Это показывает, что корреляция Пирсона не отражает ранги.
Корреляция Пирсона отражает линейную функцию, ранговая корреляция просто монотонная функция. В случае обычных данных они будут сильно похожи друг на друга, и я подозреваю, что именно поэтому ваши данные не показывают больших различий между Спирманом и Пирсоном.
Для практического примера рассмотрим следующее; Вы хотите увидеть, весят ли высокие люди больше. Да, это глупый вопрос ... но просто предположите, что это то, что вас волнует. Теперь масса не масштабируется линейно с весом, так как высокие люди также шире маленьких людей; поэтому вес не является линейной функцией роста. Тот, кто на 10% выше вас (в среднем) более чем на 10% тяжелее. Вот почему индекс массы тела использует куб в знаменателе.
Следовательно, вы предполагаете линейную корреляцию, чтобы неточно отражать соотношение рост / вес. В отличие от этого, ранг корреляции нечувствителен к раздражающим законам физики и биологии в этом случае; он не отражает, будут ли люди расти тяжелее линейно с ростом, он просто отражает, являются ли более высокие люди (более высокого ранга по одной шкале) тяжелее (более высокого ранга по другой шкале).
Более типичным примером может служить рейтинг анкет, подобный Лайкерту, например, люди оценивают что-то как «идеальное / хорошее / достойное / посредственное / плохое / ужасное». «идеальный» так же далек от «приличного», как «приличный» от «плохого» в масштабе , но можем ли мы действительно сказать, что расстояние между ними одинаково? Линейная корреляция не обязательно подходит. Ранговая корреляция более естественная.
Чтобы более точно ответить на ваш вопрос: нет, значения p для корреляций Пирсона и Спирмена не должны рассчитываться по-разному . Многое отличается в обоих случаях, как концептуально, так и численно, но если статистика теста эквивалентна, значение p будет эквивалентным.
По вопросу о предположении нормальности в корреляции Пирсона, см. Это .
В более общем смысле, другие люди разработали гораздо лучше, чем я, в отношении параметрических и непараметрических корреляций (также см. Здесь ) и того, что это означает в отношении предположений о распределении.