Как вектор переменных может представлять гиперплоскость?

Я читаю Элементы статистического обучения и на странице 12 (раздел 2.3) линейная модель обозначается как:

\hat{Y} = X^{T} \hat{β}

$\widehat{Y} = X^{T} \widehat{\beta}$

... где - транспонирование вектора-столбца предикторов / независимых переменных / входных данных. ( В нем говорится , ранее «все векторы предполагаются векторы - столбцов» , так что это не сделаешь вектор - строки , и ; вектор - столбец?) $X^{T}$ $X^{T}$ $\widehat{\beta}$

В включено « », которое нужно умножить на соответствующий коэффициент, дающий (постоянный) перехват. $X$ $1$

Это говорит:

В n - мерного ввода-вывода пространства, представляет собой гиперплоскость. Если константа включена в , то гиперплоскость включает начало координат и является подпространством; если нет, то это аффинное множество, пересекающее ось в точке . $(p + 1)$ $(X,\ \widehat{Y})$ $X$ $Y$ $(0,\ \widehat{\beta_0})$

Имеют ли « » описывают вектор , образованные конкатенациями предсказателей, интерсепт в « » и ? И почему включение « » в заставляет гиперплоскость проходить через начало координат, несомненно, что « » нужно умножить на ? $(X,\ \widehat{Y})$ $1$ $\widehat{Y}$ $1$ $X$ $1$ $\widehat{\beta_0}$

Я не понимаю книгу; любая помощь / совет / ссылки на ресурсы будут очень благодарны.

regression references statistical-learning

— Скотт
источник

Это может помочь сначала рассмотреть

. В этом случае

, при

отсекаемый отрезок. Это уравнение линии , проходящей через

. Расширения в более высокие измерения немедленно.

p = 1

$p = 1$

\hat{y} = {\hat{β}}_{0} + x \hat{β}

$\hat{y} = \hat{\beta}_0 + x \hat{\beta}$

β_{0}

$\beta_0$

(0, {\hat{β}}_{0})

$(0, \hat{\beta}_0)$

— ocram

Если помощи @ocram недостаточно, попробуйте выписать векторы и выполнить умножение.

— Питер Флом

Вот хорошая графическая презентация: blog.stata.com/2011/03/03/… . Обозначение отличается, А есть ваш X и х

\hat{β}

$\hat \beta$

— Дмитрий Владимирович Мастеров

Книга является неправильной, или , по крайней мере , это непоследовательно. Очевидно, есть

переменных, не включая константу. Таким образом, множество

действительно является гиперплоскостью, но неверно говорить, что константа «включена в

». Вместо этого я думаю , что книга означало сказать константа включена в регрессию , но все же не следует рассматривать как часть

. Поэтому модель действительно следует записать

p

$p$

{(X, \hat{Y}) | X \in R^{p}}

$\{(X,\hat{Y})|X\in\mathbb{R}^p\}$

X

$X$

X

$X$

, где

. Установка

сразу дает утверждение о перехвате.

\hat{Y} = {\hat{β}}_{0} + X^{'} \hat{β}

$\hat{Y}=\hat\beta_0 + X'\hat\beta$

β = (β_{1}, β_{2}, \dots, β_{p})^{'}

$\beta=(\beta_1,\beta_2,\ldots,\beta_p)'$

X = 0

$X=0$

— whuber

X

$X$

X

$X$

R^{p}

$\mathbb{R}^p$

p - 1

$p-1$

{(X, \hat{Y})}

$\{(X,\hat Y)\}$

2

$2$

$N$ $K$

$X$ $N\!\times\!K$ $x_i^T$ $K\!\times\!1$ $\beta$ $Y$ $N\!\times\!1$ $Y_n$

$Y$ $X$ $X$ $N\!\times\!K$ $X$ $Y$ $Y$ $X$

$Y$ $X$ $K$ $X$ $K\!+\!1$

$X$ $1$ $\beta_1$ $\beta_1$ $Y$ $x_{1i}$ $K\!+\!1$ $K$ $\beta_1$ $K$

y_{i} = β_{1} x_{1 i} + β_{2} x_{2 i} + u_{i}

$y_i=\beta_1x_{1i} + \beta_2x_{2i} +u_i$

Y = X β + u

$Y=X\beta +u$

X

$X$

N \times 2

$N\!\times\!2$

$<Y,X>$

$x_1$ $1$

y_{i} = β_{1 i} + β_{2} x_{2 i} + u_{i}

$y_i=\beta_{1i} + \beta_2x_{2i} + u_i$

X, Y

$X,\ Y$

< Y, X >

$<Y,X>$

β_{1}

$\beta_1$

x_{2 i} = 0

$x_{2i}=0$

$<0,\beta_1>$ $<0,0>$ $\beta$

(X^{'} X) β = X^{'} y ⟹ (X^{'} X) β - X^{'} y = 0 ⟹ X^{'} (y - X β) = 0.

$(X'X)\beta=X'y \implies (X'X)\beta-X'y=0 \implies X'(y-X\beta)=0.$

X

$X$

y - X β = 0

$y-X\beta=0$

( Изменить: я только что понял, что для вашего второго вопроса это как раз наоборот, вы написали, что регистрируете включение или исключение константы. Однако, я уже разработал решение здесь, и я поправляюсь, если я ошибаюсь в этом. )

Я знаю, что матричное представление регрессии может быть довольно запутанным в начале, но в конечном итоге оно значительно упрощается при выводе более сложной алгебры. Надеюсь это немного поможет.

— Majte
источник

Я думаю, что способ думать об этом, чтобы изменить это уравнение:

\hat{Y} - X^{T} \hat{β} = 0

$\widehat{Y} - X^{T} \widehat{\beta} = 0$

\hat{Y}

$\widehat{Y}$

— Dwin
источник