Корреляция эквивалентна ассоциации?


27

Мой профессор статистики утверждает, что слово «корреляция» применяется строго к линейным отношениям между переменными, тогда как слово «ассоциация» широко применяется к любому типу отношений. Другими словами, он утверждает, что термин «нелинейная корреляция» является оксюмороном.

Из того, что я могу сделать из этого раздела в статье в Википедии « Корреляция и зависимость », коэффициент корреляции Пирсона описывает степень «линейности» в отношениях между двумя переменными. Это говорит о том, что термин «корреляция» на самом деле относится исключительно к линейным отношениям.

С другой стороны, быстрый поиск в Google « нелинейной корреляции » обнаруживает ряд опубликованных работ, в которых используется этот термин.

Прав ли мой профессор или «корреляция» - это просто синоним «ассоциации»?


1
И наоборот, существует также «линейная ассоциация».
Богдановист

Ответы:


37

Нет; корреляция не эквивалентна ассоциации. Однако значение корреляции зависит от контекста.

Классическое статистическое определение состоит в том, чтобы процитировать из энциклопедии статистических наук Коца и Джонсона «меру силы линейной зависимости между двумя случайными переменными». В математической статистике «корреляция», как правило, имеет такую ​​интерпретацию.

В прикладных областях, где данные обычно являются порядковыми, а не числовыми (например, психометрия и исследования рынка), это определение не так полезно, поскольку концепция линейности предполагает данные, которые имеют свойства интервальной шкалы. Следовательно, в этих полях корреляция вместо этого интерпретируется как указание на монотонно возрастающую или убывающую двумерную модель или корреляцию рангов. Специально для этого был разработан ряд непараметрических статистик корреляции (например, корреляция Спирмена и тау-б Кендалла). Их иногда называют «нелинейными корреляциями», потому что они являются статистикой корреляции, которая не предполагает линейности.

Среди нестатиков корреляция часто означает связь (иногда с причинной коннотацией, а иногда без нее). Независимо от этимологии корреляции, реальность такова, что среди нестатиков это имеет более широкое значение, и никакое наказание их за ненадлежащее использование вряд ли изменит это. Я сделал "Google", и кажется, что некоторые из применений нелинейной корреляции, похоже, такого рода (в частности, кажется, что некоторые люди используют термин для обозначения гладкой нелинейной связи между числовыми переменными) ,

Контекстно-зависимая природа термина «нелинейная корреляция», возможно, означает, что он неоднозначен и не должен использоваться. Что касается «корреляции», вам нужно проработать контекст человека, использующего этот термин, чтобы понять, что они означают.


6
+1 вдумчивый и знающий ответ. Пожалуйста, подумайте над тем, чтобы определить начальное «нет», потому что нужно немного прочитать и подумать, чтобы понять, означает ли это «нет, профессор не прав» или «нет,« корреляция »не является синонимом« причинности », или соединение двух.
whuber

Спасибо за комментарий; Я отредактировал свой ответ соответственно.
Тим

1
Это отличный ответ (и вопрос), который дает более широкие вопросы о терминологии, языке и общении в целом, о которых мы все должны позаботиться.
Питер Эллис

3
Так что же такое ассоциация?
Овца

5

Я не вижу особого смысла пытаться отделить термины «корреляция» и «ассоциация». В конце концов, сам Пирсон (и другие) разработал меру нелинейных отношений, которую они назвали « коэффициент корреляции ».


1
Да, кажется, что на данный момент их довольно сложно распутать, особенно учитывая историю (например, как вы упоминаете) и социальное восприятие.
Behacad

2

Там, кажется, недопонимание ассоциации. Меры ассоциации (величина эффекта) присущи количественному анализу, а не качественному.


1
Может быть, вам стоит подумать о том, чтобы превратить это в комментарий. Ответы, как правило, немного больше
PhDing

@Alessandro Да, для ответа требуется больше, но у ОП недостаточно репутации (> +50), чтобы комментировать. Возможно, модератор может преобразовать его в комментарий для него.
Карл

0

Я бы сказал, что корреляция применяется к количественным данным и связь с качественными данными, и оба не имеют обязательной причинно-следственной связи.


Что вы подразумеваете под «ассоциацией с качественными данными»?
Рандел

0

Идея о том, что вес (человека) не коррелирует с ростом (потому что соответствующая функция 3-й степени, а не линейная) мне кажется очень странной. Линейная корреляция должна рассматриваться как особый случай ассоциации.


1
Но против какой (или чьей) идеи вы спорите? Здесь корреляция может быть рассчитана как (б) корреляция между наблюдаемыми и прогнозируемыми значениями из любой комбинации терминов, а также (предположительно) (а) ненулевая корреляция между весом и ростом.
Ник Кокс

-1

Соотношение и ассоциация разные. Корреляция описывает три типа отношений: позитивные, негативные и некоррелированные. Также описывается величина корреляции от 0 до 1, от -1 до 0. Ассоциация не раскрывает, какие типы ассоциации и сколько ассоциаций.


Какой вопрос здесь?
Кристоф Ханк

Поскольку вы не определяете ассоциацию и не объясняете, чем она отличается, трудно понять, почему вы думаете, что ответили на вопрос. Это не добавляет к предыдущим ответам.
Ник Кокс

-2

Что касается линейности, то ответ Тима и Ника Кокса полностью ее охватил. Я думал, что смогу внести свой вклад - это чистый способ думать о разнице между ассоциацией и корреляцией.

Ассоциация --- измеряет, насколько тесно связаны две переменные (т.е. являются ли они зависимыми или независимыми).

Корреляция --- измеряет, каким образом связаны две переменные (то есть положительная или отрицательная).


В конце я бы сказал, что вы никогда не ошибетесь, если будете относиться к ним отчетливо, это поможет с интерпретацией и анализом в долгосрочной перспективе. Надеюсь это поможет.


2
Я не понизил это, и спасибо за положительный комментарий (я только применил редактирование). К сожалению, это мешает обсуждению. Меры ассоциации часто не имеют никакого отношения к тому, какая переменная зависит от какой-либо. Корреляция также измеряет «насколько тесно»: каждое определение корреляции основано на конкретном определении того, как (в идеале) связаны переменные (линейно, монотонно и т. Д.). Семейные примеры действительно не помогают, даже в качестве аналогий: например, мама, папа, дядя не являются количественными переменными в примере. Итак, извините, но различие, которое вы проводите, совсем не чисто.
Ник Кокс

Кроме того, «общая кровь» и «отчужденность» совершенно разные!
Ник Кокс
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.