β^0β^
Если мы немного расширим ваш пример, включив третий уровень в категорию расы (скажем, азиатский ), и выберем белых в качестве эталона, то у вас будет:
- β^0= х¯Wч я т е
- β^B l a c k= х¯B l a c k- х¯Wч я т е
- β^Ев I в п= х¯Ев I в п- х¯Wч я т е
β^
- Икс¯Ев I в п= β^Ев I в п+ β^0
К сожалению, в случае нескольких категориальных переменных правильная интерпретация для перехвата уже не так ясна (см. Примечание в конце). Когда есть n категорий, каждая с несколькими уровнями и одним опорным уровнем (например, « Белый» и « Мужской» в вашем примере), общая форма для перехвата:
β^0= ∑Nя = 1Икс¯р е фе г е н с е , я- ( n - 1 ) x¯,
Икс¯р е фе г е н с е , я среднее значение эталонного уровня i-й категориальной переменной,
Икс¯ среднее значение всего набора данных
β^
Если мы вернемся к вашему примеру, мы получим:
- β^0= х¯Wч я т е+ х¯Mа л е- х¯
- β^B l a c k= х¯B l a c k- х¯Wч я т е
- β^Ев I в п= х¯Ев I в п- х¯Wч я т е
- β^Fе т в л е= х¯Fе т в л е- х¯Mа л е
β^
β^β^0, β ^B l a c k, β ^Ев I в пβ^Fе т в л е
Числовой Пример
Позвольте мне позаимствовать у @Gung стандартный числовой пример:
d = data.frame(Sex=factor(rep(c("Male","Female"),times=3), levels=c("Male","Female")),
Race =factor(rep(c("White","Black","Asian"),each=2),levels=c("White","Black","Asian")),
y =c(0, 3, 7, 8, 9, 10))
d
# Sex Race y
# 1 Male White 0
# 2 Female White 3
# 3 Male Black 7
# 4 Female Black 8
# 5 Male Asian 9
# 6 Female Asian 10
β^
aggregate(y~1, d, mean)
# y
# 1 6.166667
aggregate(y~Sex, d, mean)
# Sex y
# 1 Male 5.333333
# 2 Female 7.000000
aggregate(y~Race, d, mean)
# Race y
# 1 White 1.5
# 2 Black 7.5
# 3 Asian 9.5
Мы можем сравнить эти цифры с результатами регрессии:
summary(lm(y~Sex+Race, d))
# Coefficients:
# Estimate Std. Error t value Pr(>|t|)
# (Intercept) 0.6667 0.6667 1.000 0.4226
# SexFemale 1.6667 0.6667 2.500 0.1296
# RaceBlack 6.0000 0.8165 7.348 0.0180
# RaceAsian 8.0000 0.8165 9.798 0.0103
β^β^0
β^0= х¯Wч я т е+ х¯Mа л е- х¯
1.5 + 5.333333 - 6.166667
# 0.66666
Обратите внимание на выбор контраста
β^
β^с о н т р . ы у мβ^с о н т р . ы у м
- β^с о н т р . ы у м0= х¯
- β^с о н т р . ы у мя= х¯я- х¯
Если мы вернемся к предыдущему примеру, вы получите:
- β^с о н т р . ы у м0= х¯
- β^с о н т р . ы у мWч я т е= х¯Wч я т е- х¯
- β^с о н т р . ы у мB l a c k= х¯B l a c k- х¯
- β^с о н т р . ы у мЕв I в п= х¯Ев I в п- х¯
- β^с о н т р . ы у мMа л е= х¯Mа л е- х¯
- β^с о н т р . ы у мFе т в л е= х¯Fе т в л е- х¯
β^с о н т р . ы у м