Почему ρ Пирсона является лишь исчерпывающей мерой ассоциации, если совместное распределение является многомерным нормальным?


16

Это утверждение было высказано в ответе на этот вопрос . Я думаю, что вопрос «почему» достаточно отличается, что требует новой темы. Гугл "исчерпывающая мера ассоциации" не дал никаких результатов, и я не уверен, что означает эта фраза.

Ответы:


15

Возможно, лучше всего понимать «меру ассоциации» в многомерном распределении, состоящем из всех свойств, которые остаются неизменными, когда значения произвольно масштабируются и повторно центрируются. Это может изменить средние значения и отклонения на любые теоретически допустимые значения (отклонения должны быть положительными; средства могут быть любыми).

Коэффициенты корреляции (« Пирсона ») полностью определяют многомерное нормальное распределение. Один из способов увидеть это - взглянуть на любое формульное определение, такое как формулы для функции плотности или характеристической функции. Они включают только средства, дисперсии и ковариации - но ковариации и корреляции могут быть выведены друг от друга, когда вы знаете дисперсии.ρ

Многомерное семейство Normal не единственное семейство распределений, которое обладает этим свойством. Например, любое многомерное t-распределение (для степеней свободы, превышающих ) имеет четко определенную корреляционную матрицу и полностью определяется также его первыми двумя моментами.2


Прав ли я, что согласно определению, которое вы здесь применяете, ковариация не будет мерой ассоциации? Так как это будет иметь тенденцию расширяться по мере расширения дисперсий.
user1205901 - Восстановить Монику

2
Это верно. Хотя ковариация, очевидно, связана с мерой ассоциации, сама по себе она не является таковой, поскольку на нее влияют и другие факторы.
whuber

19

Варианты могут быть связаны способами, к которым корреляция Пирсона полностью слепа.

В многомерной норме корреляция Пирсона является «исчерпывающей» в том смысле, что единственная возможная связь индексируетсяρ, Но для других распределений (даже с нормальными полями) может быть связь без корреляции. Вот пара графиков из 3 нормальных случайных величин (x, y и x, z); они тесно связаны (если вы скажете мне значениеИкс-Вариант, я скажу вам два других, и если вы скажете мне Y Я могу сказать вам, Z), но все они некоррелированы.

введите описание изображения здесь

Вот еще один пример связанных, но некоррелированных изменений:

введите описание изображения здесь

(Основной момент делается о распределениях, хотя я иллюстрирую это здесь данными.)

Даже когда переменные коррелируют, корреляция Пирсона в целом не говорит вам, как - вы можете получить очень разные формы ассоциации, которые имеют одинаковую корреляцию Пирсона, (но когда переменные многомерны нормальны, как только я скажу вам, корреляцию вы можете точно сказать, как связаны стандартизированные переменные).

Таким образом, корреляция Пирсона не «исчерпывает» способы, которыми связаны вариации - они могут быть связаны, но некоррелированы, или они могут быть коррелированы, но связаны совершенно разными способами. [Разнообразие способов, с помощью которых может происходить ассоциация, не полностью охваченная корреляцией, весьма велико - но если произойдет какой-либо из них, у вас не может быть многовариантной нормали. Обратите внимание, однако, что ничто в моей дискуссии не подразумевает, что это (что знаниеρ определяет возможную ассоциацию) характеризует многовариантную норму, хотя цитата заголовка, кажется, предлагает это.]

(Распространенным способом решения многовариантных ассоциаций являются связки. На сайте имеется множество вопросов, касающихся связок; некоторые из них могут оказаться полезными)


Есть ли реальные данные с такими распределениями?

@ Какие существуют реальные данные, полученные из нормальных распределений? Я сомневаюсь в этом, поэтому (поскольку все мои маргиналы были нормальными на диаграммах), это сразу же дало бы ответ «нет». Цель этих примеров состояла в том, чтобы ясно показать, почему связь между случайными переменными не так проста, как иногда предполагалось (как часто люди рассчитывают корреляцию Пирсона для измерения ассоциации? Довольно часто), а также указать, что наличие нормальных полей и многомерность нормальные разные. Очень реальные примеры, когда корреляция Пирсона не отражает происходящее, безусловно, имеет место.
Glen_b

Давайте не будем говорить о распределении на мгновение. Когда мы вычисляем корреляции из облака точек, мы предполагаем основную идеальную корреляцию «геометрической формы» (линейную, гиперболическую, логарифмическую, синусоидальную и т. Д.), От которой точки в облаке отклоняются из-за некоторой «ошибки». Теперь все идеальные фигуры, которые я видел, абстрагировались от реальных данных, где они непрерывны (без разрывов) и всегда увеличиваются по крайней мере вдоль одной оси (то есть, например, не круговой). Мои знания о данных ограничены, поэтому мне было интересно, были ли на самом деле данные реального мира, чья корреляция не является непрерывной или круговой.

Например, могут быть данные, которые, если я нанесу график, будут выглядеть как два точечных облака. Если я слепо вычислю корреляции на этих данных, я могу найти их, хотя (или мне так сказали) график четко указывает на то, что я пропускаю какую-то неизвестную смешивающую переменную, которая, если бы я учел ее, разрешила бы ложные отношения в моем данные. Если бы мой профессор посмотрел на ваши примеры в форме «x» или «y», он сказал бы мне, что я смешал два разных подмножества данных.
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.