Интерпретация коэффициентов взаимодействия между категориальной и непрерывной переменной

У меня вопрос по поводу интерпретации коэффициентов взаимодействия между непрерывной и категориальной переменными. вот моя модель:

model_glm3=glm(cog~lg_hag+race+pdg+sex+as.factor(educa)+(lg_hag:as.factor(educa)), 
               data=base_708)

Coefficients:
                         Estimate Std. Error t value Pr(>|t|)    
(Intercept)               21.4836     2.0698  10.380  < 2e-16 ***
lg_hag                     8.5691     3.7688   2.274  0.02334 *  
raceblack                 -8.4715     1.7482  -4.846 1.61e-06 ***
racemexican               -3.0483     1.7073  -1.785  0.07469 .  
racemulti/other           -4.6002     2.3098  -1.992  0.04687 *  
pdg                        2.8038     0.4268   6.570 1.10e-10 ***
sexfemale                  4.5691     1.1203   4.078 5.15e-05 ***
as.factor(educa)2         13.8266     2.6362   5.245 2.17e-07 ***
as.factor(educa)3         21.7913     2.4424   8.922  < 2e-16 ***
as.factor(educa)4         19.0179     2.5219   7.541 1.74e-13 ***
as.factor(educa)5         23.7470     2.7406   8.665  < 2e-16 ***
lg_hag:as.factor(educa)2 -21.2224     6.5904  -3.220  0.00135 ** 
lg_hag:as.factor(educa)3 -19.8083     6.1255  -3.234  0.00129 ** 
lg_hag:as.factor(educa)4  -8.5502     6.6018  -1.295  0.19577    
lg_hag:as.factor(educa)5 -17.2230     6.3711  -2.703  0.00706 ***

допустим, уравнение модели:

E [cog] = a + b1 (lg_hag) + b2 (educa2 * lg_hag) + b3 (educa3 * lg_hag) + b4 (educa4 * lg_hag) + b5 (pdg, по центру) + другие ковары, где

b1 = difference in cog  with higher lg_hag among lowest education (coded as 1)
b1 + b2 = difference in cog with higher lg_hag among middle education (coded as 2)
b1 + b3 = difference in cog with higher lg_hag among high education (coded as 3)
b1 + b3 = difference in cog with higher lg_hag among very high education (coded as 4)
b5 = difference in cog with each unit increase in pdg

Мой вопрос: если моя интерпретация верна, как построить доверительные интервалы для каждой оценки эффекта взаимодействий (например, b1 + b2) из доверительных интервалов b1 и b2.

— Вы в безопасности
источник

не очень знакомы с тем, как это сделать в R. предположим, что в sas вы можете получить результат с помощью оператора "эстимейт", обратитесь к support.sas.com/documentation/cdl/en/statug/63033/HTML/default/…

— boomean

Ваша интерпретация коэффициентов модели не совсем точна. Позвольте мне сначала обобщить условия модели.

$race$ $sex$ $educa$

race $race = \{white, black, mexican, multi/other\}$

sex $sex = \{male, female\}$

educa $educa = \{1, 2, 3, 4, 5\}$

По умолчанию R использует контрасты лечения для категориальных переменных. В этих контрастах первое значение коэффициента используется для контрольного уровня, а остальные значения сравниваются с контрольным уровнем. Максимальное количество контрастов для категориальной переменной равно количеству уровней минус один.

race $race = black\ vs. race = white$ $race = mexican\ vs. race = white$ $race = multi/other\ vs. race = white$

$educa$ $1$ cog $13.8266$ $educa = 2$ $educa = 1$ as.factor(educa)2

$race$ $educa$ $race$ $educa$ $sex$

$lg\_hag$ $pdg$

lg_hagpdg $1$

$pdg$ $lg\_hag$ $educa$ $educa = 1$ $lg\_hag$

$lg\_hag \times educa$

$lg\_hag$ $educa$ $lg\_hag$ $educa$ $educa = 1$

lg_hag:as.factor(educa)2-21.2224 $lg\_hag$ $21.2224$ $educa = 2$ $educa = 1$

— Свен Хоэнштейн
источник

«Эти коэффициенты взаимодействия также справедливы для race=whiteи sex=maleтолько». Ты уверен в этом? Я спрашиваю, потому что ни, raceни sexво взаимодействии с lg_hag×educaтермином ... Я смотрю несколько текстов, я не вижу это явно указано.

— Ландрони

@landroni Склоны оцениваются для точки, где все остальные предикторы равны 0.

— Свен Хоэнштайн

Да, я тоже так понимаю. Все остальные предикторы остаются постоянными, что означает, что факторы зафиксированы на их базовом уровне. Но в этом и заключается моя загадка: я просмотрел несколько книг, которые в основном затуманивают этот тонкий, но далеко идущий нюанс. Более того, в документах часто «контролируется по отраслям», но при этом делаются выводы, как будто коэффициенты были безусловными по всей выборке, вместо того, чтобы указывать

— Ландрони

«Если в модели присутствуют контрасты лечения для категориальной переменной, оценка дополнительных эффектов основана на контрольном уровне категориальной переменной». После дальнейшего рассмотрения я не уверен (или не полностью следую вашему аргументу). Похоже, вы подразумеваете, что оценка бета для, например, pdgзависит от контрольного уровня, что явно не так. Если я изменю контрольный уровень какого-либо из факторов (например sex), оценка pdgНЕ изменится ...

— landroni

@landroni Спасибо за указание. Вы правы, это утверждение вводит в заблуждение. На самом деле, это верно только для предикторов, которые также являются частью терминов взаимодействия с категориальными переменными. Следовательно, оценка pdgдействительно не зависит от спецификации контрастов. Я изменю ответ соответственно.

— Свен Хоэнштейн