Интуиция за именами «частичные» и «маргинальные» корреляции


12

Кто-нибудь имеет представление о том, почему условную корреляцию между двумя переменными называют «частичной» корреляцией, а простую корреляцию между ними (то есть, если она не обусловлена ​​какой-либо другой переменной) называют «предельной» корреляцией? Что такое интуиция за словами «частичный» и «маргинальный»? Что они делают с «частями» или «полями»?

Было бы хорошо узнать ответ, чтобы лучше понять эти понятия.


Ответы:


11

Термин «маргинальный» очень старый. Если вы вернетесь достаточно далеко в историю, научных журналов не было (очевидно, они начали около 1665 года ). Вместо этого промежуточные результаты были сообщены с помощью рукописных писем, а окончательные результаты были записаны в книгах. До Playfair не было особого интереса к графике данных , но в книгах часто могут быть таблицы с числами в разных условиях. Рассмотрим эту таблицу:
xI,AIAIx

ABCDIxI,AxI,BxI,CxI,DIIxII,AxII,BxII,CxII,DIIIxIII,AxIII,BxIII,CxIII,DIVxIV,AxIV,BxIV,CxIV,D
; то есть они дают число для определенной комбинации условий. Тем не менее, иногда читатели хотели знать, на что похоже то или иное условие, не обращая внимания на другую переменную. Представьте есть число раз что - то случилось , когда первая переменная была и вторая переменная была . Тогда кто-то может захотеть узнать, как часто это происходило, когда первой переменной была независимо от того, какой была вторая переменная? Это легко понять, вы просто суммируетеxI,AIAIxs в первом ряду и игнорировать столбцы. Люди обычно делали подобные вещи обычно, и они (естественно) записывали числа на полях книги рядом со столом. Принимая во внимание, что оригинальные числа условны, не было названия для этих других видов чисел; они стали известны как « маргинальные ».

Какое отношение эти числа имеют к корреляциям? Что ж, это не прямая связь, но если у вас есть идея «не учитывать другие переменные», и у вас есть имя для этого («маргинальный»), когда возникает новый аналогичный контекст (то есть корреляции) имя и идея просто применяются.


Я не знаю этимологии частичных корреляций, но я могу дать вам интуицию. На самом деле это довольно просто: вы имеете дело с корреляцией между частью одной переменной и частью другой. Рассмотрим эту цифру:

введите описание изображения здесь

Мы можем представить себе , левый круг является переменной , правый круг является переменной , а верхний круг является переменной . Корреляция между двумя переменными связана с тем, насколько сильно перекрываются круги (фактически, мы можем представить, что площадь окружностей представляет изменчивость каждой переменной и что процент площади равен ). Теперь ясно , что существует некоторая корреляция между и , но есть некоторая корреляция между и , а также между и . Что если вы хотите знать, какова корреляция между этими частямиY Z r 2 X Y X Z Y Z X Y ZXYZr2XYXZYZXи , которые не были связаны сYZ ? Это было бы частичной корреляцией . Это связано с перекрытием между двумя частями кругов, которые не включают верхние ленты, которые пересекаются с верхним кругом.

Мне нравится эта веб-страница, которая позволяет легко понять частичные корреляции и смежные темы. Только первый раздел посвящен частичным корреляциям как таковым, но я настоятельно рекомендую прочитать всю страницу (хотя она довольно длинная). Хотя это и не связано напрямую, обсуждение в этой теме: где общая дисперсия между всеми IV в линейном уравнении множественной регрессии? также может быть полезным.


1
Благодаря! Вывод этого приводит меня к другому вопросу, касающемуся симметрии. Мы знаем, что . Имеет ли это же свойство частичная корреляция, то есть ? Используя формулу выше, мы могли бы написать: , и я не думаю, что всегда будет равно потому что знаменатели могут измениться (размер кругов, представляющих и основан на мере набора и мере набора ? )? ρ(X,Y)=ρ(Y,X)ρXY|Z=ρYX|ZρYX|Z=Area(1)Area(X(2+center))ρXY|ZρYX|ZXYXY
Киран К.

1
Наверное, это новый вопрос, @KiranK. Это хороший вопрос, и мы не хотим, чтобы он был скрыт в комментариях, где люди никогда его не найдут.
gung - Восстановить Монику

Хорошая идея, я разместил здесь вопрос: stats.stackexchange.com/questions/195410/…
Киран К.

0

Корреляция между 2 переменными (которую вы называете предельной корреляцией) указывает на то, что выборки обеих переменных показывают некоторую зависимость.ρXYX,Y

Частичная корреляция измеряет остаточную корреляцию между после устранения влияния смешивающей переменной с помощью линейной регрессии.ρXYZX,YZ

В математических терминах это выражается как:

ρXYZ:=ρXYρXZρYZ1ρXZ21ρYZ2

Чтобы проиллюстрировать свойства, вытекающие из этого определения, мы можем рассмотреть два предельных случая:

  • если и оба на 0% связаны с переменной , то частичная корреляция является корреляцией:XYZ

    ρXYZ=ρXY

  • Однако если на 100% коррелирует с , тогда частичная корреляция всегда равна 0 независимо от значения .YZρXY

ρXYZ=0

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.