Если линейная регрессия связана с корреляцией Пирсона, существуют ли какие-либо методы регрессии, связанные с корреляциями Кендалла и Спирмена?


27

Может быть, этот вопрос наивный, но:

Если линейная регрессия тесно связана с коэффициентом корреляции Пирсона, существуют ли какие-либо методы регрессии, тесно связанные с коэффициентами корреляции Кендалла и Спирмена?


3
В качестве простого примера , где у вас есть один пояснительный и зависимые переменный: линейная регрессия рядов от и у даст коэффициент корреляции Спирмена как коэффициент регрессии. И в этом случае х и уxyxY взаимозаменяемы в регрессии.
COOLSerdash

2
Всего несколько мыслей. Кендалла и Спирмена ρ являются коэффициентами корреляции, основанными на рангах. Тогда искомые отношения между x и y должны будут включать их ряды. Однако вычисление рангов вводит зависимость между наблюдениями, что, в свою очередь, налагает зависимость между ошибочными членами, устраняя линейную регрессию. Однако в другой ситуации моделирование структуры зависимости между x и y с помощью копул сделало бы возможной связь с τ Кендалла и / или ρ Спирмена , в зависимости от выбора связки. τρxyИксYτρ
QuantIbex

1
@QuantIbex означает ли эта зависимость ? E[εiεj]0
теневик

Ответы:


21

Существует очень простое средство, с помощью которого можно использовать практически любую меру корреляции для соответствия линейным регрессиям, и которое воспроизводит наименьшие квадраты при использовании корреляции Пирсона.

Учтите, что если наклон отношения равен , следует ожидать , что корреляция между y - β x и x равна 0βyβxx0 .

Действительно, если бы это было что-то отличное от , были бы некоторые не зафиксированные линейные отношения - это то, что мера корреляции собирала бы.0

Поэтому мы можем оценить наклон, найдя наклон, который делает выборочную корреляцию между y - ˜ β x и xβ~yβ~xx равной 0 . Во многих случаях - например, при использовании мер на основе ранга - корреляция будет ступенчатой ​​функцией значения оценки наклона, поэтому может быть интервал, где она равна нулю. В этом случае мы обычно определяем выборочную оценку как центр интервала. Часто ступенчатая функция перепрыгивает от нуля до нуля в некоторой точке, и в этом случае оценка находится в точке скачка.

Это определение работает, например, со всеми видами ранговых и надежных корреляций. Его также можно использовать для получения интервала для уклона (обычным образом - путем нахождения уклонов, которые обозначают границу между только значимыми и незначительными корреляциями).

Это только определяет наклон, конечно; как только наклон оценен, перехват может быть основан на подходящей оценке местоположения, вычисленной по остаткам . С корреляциями на основе рангов медиана является обычным выбором, но есть много других подходящих вариантов.yβ~Икс

Вот корреляция, построенная против наклона для carданных в R:

введите описание изображения здесь

Корреляция Пирсона пересекает 0 на наклоне наименьших квадратов, 3.932
Корреляция Кендалла пересекает 0 на
склоне Тейла -Сен, 3.667 Корреляция Спирмена пересекает 0, давая наклон «Линии Спирмена» 3.714

Это три оценки наклона для нашего примера. Теперь нам нужны перехваты. Для простоты я просто буду использовать средний остаток для первого перехвата и медиану для двух других (в данном случае это не имеет большого значения):

           intercept
 Pearson:  -17.573 *     
 Kendall:  -15.667
 Spearman: -16.285

* (небольшое отличие от наименьших квадратов связано с ошибкой округления в оценке наклона; несомненно, в других оценках есть аналогичная ошибка округления)

Соответствующие подогнанные линии (с использованием той же цветовой схемы, что и выше):

введите описание изображения здесь

Изменить: Для сравнения, наклон квадрант-корреляции составляет 3.333

И корреляционные наклоны Кендалла, и корреляции Спирмена существенно более устойчивы к влиятельным выбросам, чем наименьшие квадраты. Смотрите здесь для драматического примера в случае Кендалла.


(+1) Отличное объяснение! Есть ли какая-то причина, по которой Кендалл кажется более предпочтительным для Спирмена в этом контексте (по крайней мере, исходя из того факта, что корреляция Кендалла соответствует оценщику наклона с именем Тейл-Сен, а у Спирмена - нет)?
говорит амеба: восстановите Монику

4
Есть ряд причин, почему это, кажется, имеет место. Во-первых, у линии Тейла-Сен есть просто описанная оценка (медиана парных наклонов), которой у Спирмена не хватает; в небольших образцах это очень удобно для ручного расчета. Корреляция Кендалла приближается к норме быстрее и является более математически понятной . Смотрите также здесь и здесь .
Glen_b

20

ИксYY

χ2 статистика в модели ПО является именно статистикой Уилкоксона.

Модель ПО является частным случаем более общего семейства моделей кумулятивной вероятности (некоторые из них называют кумулятивной связью), включая пробит, пропорциональные опасности и дополнительные модели логарифмического журнала. Пример из практики см. В главе 15 моих раздаточных материалов .


4

Аарон Хан (1987 по эконометрике) предложил оценку корреляции максимального ранга, которая соответствует регрессионным моделям путем максимизации тау. Догерти и Томас (2012 в литературе по психологии) недавно предложили очень похожий алгоритм. Существует много работ на MRC, иллюстрирующих его свойства.

Аарон К. Хан, Непараметрический анализ обобщенной регрессионной модели: Оценка корреляции максимального ранга, Журнал эконометрики, том 35, выпуски 2–3, июль 1987 года, страницы 303-316, ISSN 0304-4076, http: // dx.doi.org/10.1016/0304-4076(87)90030-3 . ( http://www.sciencedirect.com/science/article/pii/0304407687900303 )

Dougherty, MR, & Thomas, RP (2012). Надежное принятие решений в нелинейном мире. Психологический обзор, 119 (2), 321. Получено с http://damlab.umd.edu/pdf%20articles/DoughertyThomas2012Rev.pdf .

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.