Проверка значимости трех или более корреляций с использованием преобразования Фишера


9

Исходя из моих предыдущих постов, насколько я понимаю, если у меня есть три коэффициента корреляции, мне придется тестировать их попарно, чтобы увидеть, есть ли между ними существенная разница.

Это означает, что мне нужно будет использовать преобразование Фишера, чтобы определить z-значение r, а затем значение p z (что, к счастью, рекомендуют калькуляторы в предыдущих статьях), а затем установить, является ли значение p выше или ниже, чем мое альфа-значение (0,05) для каждой пары.

То есть, если возраст от 21 до 30 лет - это возрастная группа 1, от 31 до 40 лет - это возрастная группа 2, а от 41 до 50 лет - это возрастная группа 2, мое сравнение корреляций между их покупательскими привычками и потерей веса будет следующим:

  • Группа 1 против Группы 2
  • Группа 1 против группы 3
  • Группа 2 против группы 3

Вместо трех отдельных вычислений, есть ли способ выполнить все эти вычисления за один шаг?


1
Не могли бы вы быть немного более подробным? Как в - каков ваш ответ, ваши объяснительные переменные, и какие корреляции вас интересуют? Вы не можете преобразовать Фишера для проверки корреляции, может быть достаточно простого t-критерия.
Suncoolsu

@suncoolsu Я проверяю соотношение между покупательской привычкой и набором веса для этих трех групп. Мои результаты таковы: группа 1: r = .8978, n = 105; Группа 2: r = 0,5678, n = 95; и группа 3: r = 0,7865, n = 120.
Adhesh Josh

Я думаю, что ваши данные проходят IOTT. Это межокулярный тест на травму - он попадает вам в глаза. Если корреляции .9, .6 и .8 не отличаются друг от друга, что это? Но если вам действительно интересно
Питер Флом

Ответы:


4

Ваш вопрос является прекрасным примером регрессионных моделей с количественными и качественными предикторами. В частности, три возрастные группы - - являются качественными переменными, а количественные переменными являются покупательские привычки и потеря веса (я предполагаю это, потому что вы рассчитываете корреляции).1,2,&3

Я должен подчеркнуть, что это гораздо лучший способ моделирования, чем вычисление отдельных групповых корреляций, потому что у вас больше данных для моделирования, поэтому ваши оценки ошибок (p-значения и т. Д.) Будут более надежными. Более техническая причина заключается в большей степени свободы в статистике t-критерия для проверки значимости коэффициентов регрессии.

Работая по правилу, согласно которому качественные предикторы могут обрабатываться переменными индикатора , здесь нужны только две переменные индикатора, , которые определены следующим образом:cc1X1,X2

X1=1 if person belongs to group 1;0 otherwise.
X2=1 if person belongs to group 2;0 otherwise.

Это означает, что группа представлена ​​как ; представлять свой ответ - торговые привычки , как и количественного пояснительная потери веса переменной как . Теперь вы подходите этой линейной модели3X1=0,X2=0YW

E[Y]=β0+β1X1+β2X2+β3W.
Очевидный вопрос: имеет ли значение, если мы изменим и (потому что я случайно выбрал покупательские привычки в качестве переменной ответа). Ответ - да - оценки коэффициентов регрессии будут меняться, но тест на «связь» между обусловленными группами (здесь t-тест, но он такой же, как тест на корреляцию для одной переменной-предиктора) не будет изменение. Specficially,WY

E[Y]=β0+β3W -- for third group,
E[Y]=(β0+β2)+β3W -- for second group,
E[Y]=(β0+β1)+β3W -- for first group,
Это эквивалентно тому , что 3 отдельных линий, в зависимости от групп, если участок против . Это хороший способ визуализировать то, что вы тестируете, имеет смысл (в основном это форма EDA и проверка модели, но вам нужно правильно различать сгруппированные наблюдения). Три параллельные линии указывают на отсутствие взаимодействия между тремя группами и , а большое взаимодействие подразумевает, что эти линии будут пересекаться друг с другом.YWW

Как сделать тесты, которые вы спрашиваете. По сути, после того, как вы подберете модель и получите оценки, вам нужно протестировать некоторые контрасты. Специально для ваших сравнений:

Группа 1 против группы 3:  β 1 + β 0 - β 0 = 0 , Группа 2 против группы 1:  β 2 + β 0 - ( β 0 + β 1 ) = 0.

Group 2 vs Group 3: β2+β0β0=0,
Group 1 vs Group 3: β1+β0β0=0,
Group 2 vs Group 1: β2+β0(β0+β1)=0.

Тестирование на эквивалентность уклонов отличается от тестирования на эквивалентность корреляций. См., Например: jessicagrahn.com/uploads/6/0/8/5/6085172/comparecorrcoeff.doc
Вольфганг,

t=ρn21ρ2tn2

Кроме того, в вашем документе говорится о сравнении разных групп населения, что не относится к одному предиктору.
Suncoolsu

H0:β1=β2=β3H0:ρ1=ρ2=ρ3β

Да, вы правы (как я уже говорил), но мой ответ предполагает, что ОП интересовался определением взаимосвязи между потерей веса и покупательскими привычками на основе групп (не обязательно корреляция). Я предполагаю, что был неправ, потому что ОП принял другой ответ. Тем не менее, этот ответ служит полезной альтернативой (я надеюсь).
Suncoolsu

1

Попарное тестирование в этой ситуации (пока) не оправдано описанием данных. Вы должны использовать методы многопараметрической регрессии. R вызов может быть:

lm( weight_end ~ shop_habit + age_grp + weight_begin)

Построение 3 категорий - не лучший метод контроля возраста (или анализа его вклада, если это основной вопрос), поскольку категоризация может исказить непрерывные отношения, а сплайн-термины устраняют необходимость выбора произвольных точек разделения. Как только появятся достаточные доказательства связи изменения веса после надлежащего анализа, появятся специальные тестовые варианты, которые могут быть развернуты.

(Я согласен с большей частью того, что @whuber выразил в комментарии, и я обычно нахожу его комментарий авторитетным, но не понимаю его позицию относительно подходов регрессии.)

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.