Это отличный вопрос, достойный того, кто мыслит статистически ясно, потому что он признает тонкий, но важный аспект множественного тестирования.
Существуют стандартные методы для корректировки p-значений множественных коэффициентов корреляции (или, что эквивалентно, для расширения их доверительных интервалов), такие как методы Бонферрони и Сидака ( см. ). Однако они слишком консервативны с большими корреляционными матрицами из-за врожденных математических соотношений, которые должны соблюдаться среди коэффициентов корреляции в целом. (Некоторые примеры таких отношений см. В последнем вопросе и в последующей ветке .) Один из лучших подходов для решения этой ситуации - проведение теста на перестановку (или повторную выборку)., Это легко сделать с помощью корреляций: на каждой итерации теста просто случайным образом скремблируйте порядок значений каждого из полей (тем самым разрушая любую внутреннюю корреляцию) и пересчитайте полную корреляционную матрицу. Сделайте это для нескольких тысяч итераций (или более), затем суммируйте распределения элементов корреляционной матрицы, например, указав их 97,5 и 2,5 процентили: они будут служить взаимно симметричными двусторонними 95% доверительными интервалами при нулевом значении. гипотеза о не корреляции. (В первый раз, когда вы сделаете это с большим количеством переменных, вы будете удивлены, насколько высокими могут быть некоторые коэффициенты корреляции, даже если нет внутренней корреляции.)
При сообщении результатов, независимо от того, какие вычисления вы делаете, вы должны включать следующее:
Размер корреляционной матрицы ( т. Е. Сколько переменных вы просмотрели).
Как вы определили p-значения или «значимость» любого из коэффициентов корреляции ( например , оставили их как есть, применили поправку Бонферрони, провели тест перестановки или что-то еще).
Смотрели ли вы на альтернативные меры корреляции, такие как ранговая корреляция Спирмена . Если вы это сделали, укажите также, почему вы выбрали метод, о котором вы действительно сообщаете и используете.