как интерпретировать член взаимодействия в формуле lm в R?


9

В R, если я вызываю lm()функцию следующим образом:

lm.1 = lm(response ~ var1 + var2 + var1 * var2)
summary(lm.1)

Это дает мне линейную модель переменной отклика с var1, var2и взаимодействие между ними. Однако как именно мы численно интерпретируем термин взаимодействия?

Документация говорит, что это «крест» между var1и var2, но не дает объяснения, что именно является «крест».

Для меня было бы полезно узнать, какие точные числа R рассчитывается для учета взаимодействия между двумя переменными.


Хотели бы вы конкретно знать, как R создает матрицу проектирования для этой формулы, или вы более широко заинтересованы в том, как интерпретировать такой мультипликативный («взаимодействие») термин в терминах подобранной модели?
Момо

Меня больше интересует, как интерпретировать этот мультипликативный термин. Например, если я хочу написать линейную формулу (математическую, а не R-формулу ...), что я должен вставить в мультипликативный член?
Энцо

Чтобы объяснить, что означает крест, взгляните на вычисление, а var3 <- var 1 * var2затем построениеlm.2 <- lm(response ~ var1 + var2 + var3)
Джеймс Стэнли,

1
так что это просто умножение входа?
Энцо

1
@Enzo, да, крест буквально два слагаемых умножаются - интерпретация в значительной степени будет зависеть от того , var1и var2оба непрерывно (довольно трудно интерпретировать, на мой взгляд) , или один из них является , например , двоичная категоричен (. Проще рассматривать) См. Этот ответ для некоторых примеров интерпретации Питера Флома: stats.stackexchange.com/a/45512/16974
Джеймс Стэнли,

Ответы:


8

Стандартный способ написать уравнение прогнозирования для вашей модели:

Y^знак равноб0+б1*Икс1+б2*Икс2+б12*Икс1*Икс2

Но понять взаимодействие немного легче, если мы рассмотрим это по-другому:

Y^знак равно(б0+б2*Икс2)+(б1+б12*Икс2)*Икс1

С помощью этого факторинга мы можем видеть, что для данного значения y-точка пересечения для x 1 равна b 0 + b 2x 2, а наклон на x 1 равенИкс2Икс1б0+б2*Икс2Икс1(б1+б12*Икс2)YИкс1Икс2

YИкс1Икс2Predict.PlotTkPredict


3

Икс1Икс2lm

Yзнак равно4Икс1+2Икс2+1,5Икс1Икс2

Это то, что вы хотели?


3

Про взаимодействия проще всего думать в терминах дискретных переменных. Возможно, вы изучили двусторонние ANOVA, где у нас есть две группирующие переменные (например, пол и возрастная категория, с тремя уровнями возраста), и вы смотрите на то, как они относятся к некоторой непрерывной мере (нашей зависимой переменной, например, IQ).

Термин x1 * x2, если он значительный, можно понимать (в этом тривиальном вымышленном примере) как IQ, который ведет себя по-разному на разных возрастных уровнях для разных полов. Например, возможно, IQ является стабильным для мужчин во всех трех возрастных группах, но молодые женщины начинаются ниже молодых мужчин и имеют восходящую траекторию (при этом в старшей возрастной группе среднее значение выше, чем в старшей возрастной группе для мужчин). На графике средних значений это означало бы горизонтальную линию для мужчин в середине графика и, возможно, линию для 45 градусов для женщин, которая начинается ниже мужчин, но заканчивается над мужчинами.

Суть в том, что когда вы перемещаетесь по уровням одной переменной (или «держите константу X1»), то, что происходит в другой переменной, изменяется. Эта интерпретация также работает с непрерывными предикторами, но ее не так просто проиллюстрировать. В этом случае вы можете принять конкретные значения X1 и X2 и посмотреть, что происходит с Y.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.