Геометрическо-статистическое объяснение.
Представьте, что вы создаете диаграмму рассеяния «наизнанку», где объектов - это оси, а переменные и - это точки . Это называется сюжетным пространственным сюжетом (в отличие от обычного переменного пространственного сюжета). Поскольку на графике есть только 2 точки, все измерения в таком пространстве, кроме двух произвольных измерений, которые могут поддерживать 2 точки плюс начало координат, являются избыточными и могут быть безопасно отброшены. И вот мы остались с самолета. Мы рисуем векторные стрелки от начала координат до точек: это наши переменные и как векторы в предметном пространстве данных.n 2 XYXY
Теперь, если переменные были отцентрированы, то в предметном пространстве косинус угла между их векторами является их коэффициентом корреляции . На рисунке ниже векторы и ортогональны: их . Некоррелированность была предпосылкой, изложенной @Dilip в их ответе.XYr=0
Также для переменных по центру их векторные длины в предметном пространстве являются их стандартными отклонениями . На рис. и имеют одинаковую длину, равные отклонения также были обязательным условием @Dilip.XY
Чтобы нарисовать переменную или переменную мы просто используем сложение или вычитание вектора, которые мы забыли со времен школы (переместите вектор Y в конец вектора X и направление инвертирования в случае вычитания, - это показано серыми стрелками на рис., - затем нарисуйте вектор, на который указывает серая стрелка).X−YX+Y
Становится совершенно ясно, что длина векторов или (стандартное отклонение этих переменных) по теореме Пифагора равна , а угол между и или равен 45 градусов, который косинус - корреляция -X−YX+Y2σ2−−−√XX−YX+Y0.707...