Какие надежные методы корреляции действительно используются?


18

Я планирую провести симуляционное исследование, в котором сравниваю эффективность нескольких надежных методов корреляции с различными распределениями (искаженное, с выбросами и т. Д.). Под устойчивым я имею в виду идеальный случай быть устойчивым к: а) перекосам, б) выбросам и в) тяжелым хвостам.

Наряду с корреляцией Пирсона в качестве базовой линии, я подумал включить следующие более надежные меры:

  • Спирмена ρ
  • Процентная корреляция изгиба (Wilcox, 1994, [1])
  • Эллипсоид минимального объема, определитель минимальной ковариации ( cov.mve/ cov.mcdс cor=TRUEопцией)
  • Вероятно, Winsorized корреляция

Конечно, есть еще много вариантов (особенно, если вы включите надежные методы регрессии), но я хочу ограничиться наиболее часто используемыми / наиболее перспективными подходами.

Теперь у меня есть три вопроса (не стесняйтесь отвечать только на один):

  1. Существуют ли другие надежные корреляционные методы, которые я мог бы / должен включить?
  2. Какие надежные методы корреляции на самом деле используются в вашей области? (Если говорить о психологических исследованиях: за исключением Спирмена , я никогда не видел ни одной надежной техники корреляции за пределами технической статьи. Бутстрапинг становится все более и более популярным, но других надежных статистических данных пока более или менее не существует).ρ
  3. Есть ли уже систематические сравнения методов множественной корреляции, о которых вы знаете?

Также не стесняйтесь комментировать список методов, приведенных выше.


[1] Wilcox, RR (1994). Коэффициент корреляции изгиба в процентах. Психометрика , 59, 601-616.

Ответы:


3

Исходя из психологии, корреляция Пирсона и Спирмена, по-видимому, является наиболее распространенной. Тем не менее, я думаю, что многие исследователи в области психологии участвуют в различных процедурах манипулирования данными для составляющих переменных до выполнения корреляции Пирсона. Я полагаю, что любой анализ надежности должен учитывать последствия:

  • преобразования одной или обеих переменных, чтобы переменные приближались к нормальному распределению
  • корректировка или удаление выбросов на основе статистического правила или знания проблем с наблюдением

1

Я бы порекомендовал вам эту прекрасную статью, опубликованную в журнале Science в 2011 году, которую я ранее разместил здесь. Существует предложение одной новой надежной меры вместе с исчерпывающим и превосходным сравнением с другими. Кроме того, все меры проверены на прочность. Обратите внимание, что эта новая мера также способна идентифицировать более одного функционального отношения в данных, а также идентифицировать нефункциональные отношения.


Большой! Я очень внимательно посмотрю на это. Выглядит очень перспективно ...
Феликс С

1
Можете ли вы поставить название статьи, пожалуйста? Кажется, он исчез!
Creatron

2
Обнаружение новых ассоциаций в больших наборах данных
Мирослав Сабо

6
Эта статья получила много критики. Кажется, это преувеличено. Много-много-много средств массовой информации и пиара работают, но, похоже, это плохо проваливается на тривиальных примерах, таких как ▄▀, которые он признает «линейными». IIRC их исследование также не было справедливым, поскольку они использовали ранги для своего собственного метода; но по сравнению с Пирсоном вместо Спирмена корреляции.
Аноним-Мусс-Восстановить Монику

8
В частности, см. Опровержения этого подхода по адресу: statweb.stanford.edu/~tibs/reshef/comment.pdf , ie.technion.ac.il/~gorfinm/files/science6.pdf , arxiv.org/abs/1301.7745v1
метапертура

1

Тау Кендалла очень широко используется в теории связок, вероятно, потому, что это очень естественная вещь для архимедовых связок. Графики совокупного тау Кендалла были введены Дженестом и Ривестом как способ выбора модели среди семейств двумерных связок.

Ссылка на статью Genest Rivest (1993)


1

Некоторые надежные меры корреляции:

  1. Ранговый коэффициент корреляции Спирмена

  2. Коэффициент корреляции Signum (Blomqvist)

  3. Тау Кендалла

  4. Абсолютный коэффициент корреляции Брэдли

  5. Коэффициент корреляции Шевлякова

Ссылки:

• Бломквист, Н. (1950) «О мере зависимости двух случайных величин», Анналы математической статистики, 21 (4): 593-600. • Брэдли, C. (1985) «Абсолютная корреляция», Математическая газета, 69 (447): 12-17. • Шевляков Г.Л. (1997) «Об робастной оценке коэффициента корреляции», Журнал математических наук, 83 (3): 434-438. • Спирмен, C. (1904) «Доказательство и измерение связи между двумя вещами», Американский журнал психологии, 15: 88-93.


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.