Меня интересует геометрический смысл множественной корреляции и коэффициента детерминации в регрессии или в векторной записи,R 2 y i = β 1 + β 2 x 2 , i + ⋯ + β k x k , i + ϵ i
Здесь матрица дизайна имеет строк и столбцов, первым из которых является , вектор единиц, соответствующий перехвату . n k x 1 = 1 n β 1
Геометрия более интересна в мерном пространстве предметов, нежели в мерном пространстве переменных. Определите матрицу шляпы:к
Это ортогональная проекция на пространство столбцов , т. Е. Плоскость через начало координат, охватываемая векторами, представляющими каждую переменную , первая из которых . Затем проецирует вектор наблюдаемых откликов на свою "тень" на плоскость, вектор подходящих значений , и если мы посмотрев вдоль пути проекции, мы увидим вектор невязок образует третью сторону треугольника. Это должно дать нам два пути к геометрической интерпретации:
- Квадрат коэффициента множественной корреляции , который определяется как корреляция между и . Это будет выглядеть геометрически как косинус угла.
- В терминах длин векторов: например, .
Я был бы рад увидеть краткий отчет, который объясняет:
- Более мелкие детали для (1) и (2),
- Почему (1) и (2) эквивалентны,
- Вкратце, как геометрическая проницательность позволяет нам визуализировать основные свойства , например, почему он становится равным 1, когда дисперсия шума становится равной 0. (В конце концов, если мы не можем интуитивно понять нашу визуализацию, то это не более чем Приятная картина.)
Я ценю, что это более просто, если переменные центрируются первыми, что убирает перехват из вопроса. Однако в большинстве описаний учебников, которые вводят множественную регрессию, матрица дизайна , как я изложил. Конечно, было бы хорошо, если экспозиция копается в пространстве, охватываемом центрированными переменными, но для понимания линейной алгебры из учебника было бы очень полезно связать это обратно с тем, что происходит геометрически в нецентрированной ситуации. Действительно проницательный ответ мог бы объяснить , что именно разрушение геометрически , когда термин перехватывать отбрасывается - то есть , когда вектор1 нудаляется из связующего набора. Я не думаю, что этот последний момент можно решить, рассматривая только центрированные переменные.