Тест на значимость разности коэффициента корреляции Спирмена


13

(Большое спасибо за быстрые ответы! Я плохо задал вопрос, поэтому позвольте мне повторить.)

Я не знаю, как выяснить, является ли разница между двумя корреляциями Спирмена статистически значимой. Я хотел бы знать, как это выяснить.

Причина, которую я хотел выяснить, заключается в том, что в следующей статье: Основанная на Википедии семантическая интерпретация для обработки естественного языка , Габрилович и Маркович ( Журнал исследований искусственного интеллекта 34 (2009) 443-498).

В Таблице 2 (стр. 457) авторы показывают, что их метод (ESA-Wikipedia) достигает более высокой и статистически значимой корреляции Спирмена, чем другие методы, и я хотел бы сделать то же самое, чтобы показать, что мой метод лучше, чем предыдущий методы для какой-то проблемы.

Я не знаю, как они рассчитали статистическую значимость, и я хотел бы знать. Автор статьи утверждал, что ранговая корреляция Спирмена рассматривалась как корреляция Пирсона. Я не уверен, что это правильный способ сделать это. У меня есть две корреляции Спирмена, и я хотел бы знать, является ли разница между ними статистически значимой или нет.

Мне известно, что веб-сайты, такие как http://faculty.vassar.edu/lowry/rdiff.html , предоставляют онлайн-калькулятор для получения разницы между двумя корреляциями Пирсона. Я не могу найти аналогичный онлайн-калькулятор для разницы между двумя корреляциями Спирмена.

Решение по ссылке, предоставленной Питером Фломом

ПРИМЕЧАНИЕ. Процедуры поддерживают только корреляции Спирмена ниже 0,6.

  1. Пусть zA = преобразование Фишера наблюдаемой корреляции множество A , zB = Фишер преобразование наблюдаемой корреляции множества B .

  2. Для , пусть , где - преобразование Фишера множества одного левого выхода корреляция, полученная путем удаления , повторного ранжирования и повторного вычисления корреляции. (Каждый основан на пары, каждое удаление является временным, для этого я только, не является постоянными.) Повторите для множества .i=1,,n ( x i , y i ) z A i ByAi=nzA(n1)zAi A n - 1zAiA(xi,yi)zAin1B

  3. Вy¯A=yAi/n - преобразование Фишера со сглаживанием. Повторите для множества .B

  4. ˉ y A Bvy¯A=(yAiy¯A)2/(n(n1)) - дисперсия . Повторите для множества .y¯AB

  5. Используйте гетероскедастический (Welch-Satterthwaite) тест, чтобы сравнить две оценки с откидным верхом:t

t=y¯Ay¯Bvy¯A+vy¯B,df=(vy¯A+vy¯B)2vy¯A2nA1+vy¯B2nB1
где и - количество выборок из набора и соответственно.nAnBAB

Перед первым редактированием

У меня есть набор рейтинга, оцененный человеком (HUMAN-RANKING), набор рейтинга, сгенерированный популярным в настоящее время методом (PRESENT-RANKING), и, наконец, набор рейтинга, сгенерированный моим целевым методом (MY-RANKING) ,

Я вычислил корреляцию Спирмена между ЧЕЛОВЕЧЕСКИМ И РЕЙТИНГОМ. Позвольте мне назвать это: ЧЕЛОВЕК-НАСТОЯЩЕЕ-СПЕАРМАН.

Затем я выяснил корреляцию Спирмена между ЧЕЛОВЕЧЕСКИМ И РЕЙТИНГОМ. Позвольте мне назвать это: ЧЕЛОВЕК-МОЙ-SPEARMAN.

Как я могу узнать, является ли разница между HUMAN-MY-SPEARMAN и HUMAN-PRESENT-SPEARMAN статистически значимой?


2
Добро пожаловать, Патрик. Я борюсь с той же проблемой, но с Pearson r. Если вы проверите мои записи, вы получите представление о том, что вы можете сделать.
Adhesh Josh

Хотя у вас могут возникнуть трудности с формулировкой этого вопроса в статистических терминах - было бы полезно, если бы мы знали, что именно вас заинтересовало. Заинтересованы ли вы в близости корреляции (насколько близко баллы предсказывают друг друга) или в существовании взаимосвязи больше чем шанс. Принимая во внимание, что у вас, по-видимому, есть ранжированные данные, повторенные во времени, может быть полезно прочитать некоторые коэффициенты корреляции внутри класса. Я надеюсь, что у меня есть это право, вопрос не совсем ясен.
Росс

Спасибо Adhesh и Россер. Я прошу прощения за плохое описание моего вопроса. Я переписал это. Надеюсь, это стало понятным вопросом.
Патрик Чан

Здравствуй! В настоящее время я борюсь с той же проблемой. У вас случайно есть готовый код, который реализует ваше предложение? Кроме того, почему это работает только для значений корреляции ниже 0,6?
Общество

Ответы:


1

В цитируемой вами статье метод объясняется в следующих терминах:

[...] мы показываем статистическую значимость различия между производительностью версии ESA-Wikipedia (26 марта 2006 г.) и других алгоритмов с помощью z-преобразования Фишера (Press, Teukolsky, Vetterling & & Flannery, Numeric Рецепты на языке Си: Искусство научных вычислений, издательство Кембриджского университета, 1997, раздел 14.5).

Я предлагаю вам перейти по этой ссылке или взглянуть на страницу Википедии с коэффициентом Спирмена для подробностей.


1
Спасибо Гильермо. Я подозревал, что они рассматривали ранговую корреляцию Спирмена как корреляцию Пирсона и вычисляли разницу между двумя корреляциями Пирсона. Однако, мне кажется, это не правильный способ сделать это, и поэтому я делаю пост здесь.
Патрик Чан

Возможно, вы знаете о работающей реализации (желательно онлайн), потому что это то, что после ОП?
ЧЛ
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.