Ваш вопрос является прекрасным примером регрессионных моделей с количественными и качественными предикторами. В частности, три возрастные группы - - являются качественными переменными, а количественные переменными являются покупательские привычки и потеря веса (я предполагаю это, потому что вы рассчитываете корреляции).1 , 2 , &3
Я должен подчеркнуть, что это гораздо лучший способ моделирования, чем вычисление отдельных групповых корреляций, потому что у вас больше данных для моделирования, поэтому ваши оценки ошибок (p-значения и т. Д.) Будут более надежными. Более техническая причина заключается в большей степени свободы в статистике t-критерия для проверки значимости коэффициентов регрессии.
Работая по правилу, согласно которому качественные предикторы могут обрабатываться переменными индикатора , здесь нужны только две переменные индикатора, , которые определены следующим образом:сc−1X1,X2
X1=1 if person belongs to group 1;0 otherwise.
X2=1 if person belongs to group 2;0 otherwise.
Это означает, что группа представлена как ; представлять свой ответ - торговые привычки , как и количественного пояснительная потери веса переменной как . Теперь вы подходите этой линейной модели3X1=0,X2=0YW
E[Y]=β0+β1X1+β2X2+β3W.
Очевидный вопрос: имеет ли значение, если мы изменим и (потому что я случайно выбрал покупательские привычки в качестве переменной ответа). Ответ - да - оценки коэффициентов регрессии будут меняться, но тест на «связь» между обусловленными группами (здесь t-тест, но он такой же, как тест на корреляцию для одной переменной-предиктора) не будет изменение. Specficially,
WY
E[Y]=β0+β3W -- for third group,
E[Y]=(β0+β2)+β3W -- for second group,
E[Y]=(β0+β1)+β3W -- for first group,
Это эквивалентно тому , что 3 отдельных линий, в зависимости от групп, если участок против . Это хороший способ визуализировать то, что вы тестируете, имеет смысл (в основном это форма EDA и проверка модели, но вам нужно правильно различать сгруппированные наблюдения). Три параллельные линии указывают на отсутствие взаимодействия между тремя группами и , а большое взаимодействие подразумевает, что эти линии будут пересекаться друг с другом.
YWW
Как сделать тесты, которые вы спрашиваете. По сути, после того, как вы подберете модель и получите оценки, вам нужно протестировать некоторые контрасты. Специально для ваших сравнений:
Группа 1 против группы 3: β 1 + β 0 - β 0 = 0 , Группа 2 против группы 1: β 2 + β 0 - ( β 0 + β 1 ) = 0.
Group 2 vs Group 3: β2+β0−β0=0,
Group 1 vs Group 3: β1+β0−β0=0,
Group 2 vs Group 1: β2+β0−(β0+β1)=0.