Да, это все равно будет ошибкой.
Вот очень простая фигура, показывающая четыре разные ситуации. В каждом случае красные точки представляют женщин, синие точки представляют мужчин, горизонтальная ось представляет размер мозга, а вертикальная ось представляет IQ. Я сгенерировал все четыре набора данных так, чтобы:
всегда есть одинаковая разница в среднем размере мозга между мужчинами ( ) и женщинами ( 28 - произвольные единицы). Это средние показатели популяции, но эта разница достаточно велика, чтобы быть статистически значимой при любом разумном размере выборки;2228
всегда есть нулевая разница в среднем IQ между мужчинами и женщинами (обе ), а также нулевая корреляция между полом и IQ;100
сила корреляции между размером мозга и IQ варьируется, как показано на рисунке.
В верхнем левом графике внутриполовая корреляция (рассчитывается отдельно для мужчин и отдельно для женщин, затем усредняется) составляет , как в вашей цитате. В верхнем правом подпункте общая корреляция (по мужчинам и женщинам вместе) составляет 0,3 . Обратите внимание, что в вашей цитате не указано число 0,33 . В нижнем левом графике корреляция между полами равна 0,9 , как в вашем гипотетическом примере; в нижнем правом подпункте общая корреляция составляет 0,9 .0,30,30,330.90.9
Таким образом, вы можете иметь любое значение корреляции, и не имеет значения, рассчитывается ли оно в целом или внутри группы. Каким бы ни был коэффициент корреляции, вполне возможно, что существует нулевая корреляция между полом и IQ и нулевая гендерная разница в среднем IQ.
Изучение нетранзитивности
Давайте исследуем все возможности, следуя подходу, предложенному @kjetil. Предположим , у вас есть три переменные и (без ограничения общности) Предположим , что соотношение между х 1 и х 2 является > 0 и корреляции между х 2 и х 3 является б > 0 . Вопрос в том, каково минимально возможное положительное значение корреляции λ между x 1 и x 3.Икс1, х2, х3Икс1Икс2а > 0Икс2Икс3б > 0λИкс1Икс3? Иногда оно должно быть положительным или всегда может быть нулевым?
Матрица корреляции имеет вид и должна иметь неотрицательный определитель, т. Е. D e t R = - λ 2 + 2 a b λ - ( a 2 + b 2 - 1 ) ≥ 0 , что означает, что λ должен лежать между a b ± √
R = ⎛⎝⎜1aλa1бλб1⎞⎠⎟
d e t R =- λ2+ 2 a b λ - ( a2+ б2- 1 ) ≥ 0 ,
λЕсли оба корня положительны, то минимально возможное значение
λравно меньшему корню (и
λдолжен быть положительным!). Если ноль находится между этими двумя корнями, то
λможет быть нулем.
а б ± ( 1 - а2) ( 1 - б2)-------------√,
λλλ
Мы можем решить это численно и построить минимально возможное положительное значение для различных a и b :λaб
Неформально можно сказать, что корреляции были бы транзитивными, если бы при и b > 0 можно было сделать вывод, что λ > 0 . Мы видим , что для большинства значений через и Ь , λ может быть равно нулю, что означает , что корреляции непереходный. Однако для некоторых достаточно высоких значений a и b корреляция λ должна быть положительной , то есть, в конце концов, существует «некоторая степень транзитивности», но ограниченная только очень высокими корреляциями. Обратите внимание, что оба корреляции a и bа > 0б > 0λ > 0aбλaбλ aб должен быть высоким.
Мы можем выработать точное условие для этой «транзитивности»: как упоминалось выше, меньший корень должен быть положительным, то есть , что эквивалентноa2+b2>1. Это уравнение круга! И действительно, если вы посмотрите на рисунок выше, вы заметите, что синяя область образует четверть круга.а б - ( 1 - а2) ( 1 - б2)-------------√> 0a2+ б2> 1
В вашем конкретном примере корреляция между полом и размером мозга довольно умеренная (возможно, ), а корреляция между размером мозга и IQ составляет b = 0,33 , что находится в пределах синей области ( a 2 + b 2 < 1 ), означая, что λ может быть положительным, отрицательным или нулевым.а = 0,5б = 0,33a2+ б2< 1λ
Соответствующая фигура из оригинального исследования
Вы хотели избежать обсуждения пола и умственных способностей, но я не могу не отметить, что, взглянув на полную цифру из оригинальной статьи ( Gur et al. 1999 ), можно увидеть, что, хотя в словесной оценке IQ нет гендерных различий, существует очевидная и значительная разница в пространственном балле IQ! Сравните подзаговоры D и F.