Сравнение коэффициентов корреляции


11

У меня есть два набора данных, где у меня есть ~ 250.000 значений для 78 и 35 образцов. Некоторые образцы являются членами семьи, и это может повлиять на данные. Я рассчитал парную корреляцию, и она варьируется между 0,7 и 0,95, но я хотел бы знать, есть ли существенная разница в коэффициентах корреляции внутри семьи? Каков наилучший способ сделать это? Спасибо

Ответы:


6

Общий способ сравнения двух коэффициентов корреляции р 1 , ρ 2 является использование Z-преобразования метод Фишера, который говорит , что г deg ; С т а н ч ( р ) приближенно нормально со средним значением в г deg ; С т а н ч ( ρ ) и стандартное отклонение 1 / ρ^1,ρ^2aрсTaNчас(ρ^)aрсTaNчас(ρ) . Если выборки независимы, то вы преобразуете каждый коэффициент корреляции, и разница между двумя преобразованными корреляциями будет нормальной со средним значениемarctanh(ρ 1 )-arctanh(ρ 2 )и стандартным отклонение1/N-3aрсTaNчас(ρ1)-aрсTaNчас(ρ2) . Исходя из этого, вы можете сформироватьz-статистику и выполнить тестирование, как в обычномдвухэлементномz-тесте.1/(N1-3)+1/(N2-3)ZZ


2

Хотя ответ @ Macro хорош, он требует предположения о (не) зависимости статистики. Другой подход заключается в использовании начальной загрузки. Идея состоит в том, чтобы оставить одну переменную фиксированной и переставить другую, вычислить корреляцию для каждой из ваших выборок и определить их разницу. Повторите много раз, чтобы получить распределение и использовать это распределение, чтобы проверить гипотезу, что корреляции одинаковы. Структура вашего набора данных мне не так понятна, поэтому трудно предоставить более подробную информацию.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.