конспект
Каждое утверждение в вопросе можно понимать как свойство эллипсов. Только свойство частности к двумерному нормального распределения , который необходим тот факт , что в стандартном двумерное нормальное распределение --Для которого и являются некоррелированными - условная дисперсия не зависит от . (Это, в свою очередь, является прямым следствием того факта, что отсутствие корреляции подразумевает независимость для совместно нормальных переменных.)X,YXYYX
Следующий анализ точно показывает, какое свойство эллипсов задействовано, и выводит все уравнения вопроса, используя элементарные идеи и простейшую возможную арифметику, способом, который должен легко запоминаться.
Циркулярно-симметричные распределения
Распределение вопроса является членом семейства двумерных нормальных распределений. Все они являются производными от базового члена, стандартного двумерного нормали, который описывает два некоррелированных стандартных распределения нормалей (образующих его две координаты).
Левая сторона представляет собой рельефный график стандартной двумерной нормальной плотности. Правая сторона показывает то же самое в псевдо-3D, с вырезанной передней частью.
Это пример циркулярно-симметричного распределения: плотность изменяется в зависимости от расстояния от центральной точки, но не от направления от этой точки. Таким образом, контуры его графика (справа) представляют собой круги.
Однако большинство других двумерных нормальных распределений не являются круговыми симметричными: их поперечные сечения являются эллипсами. Эти эллипсы моделируют характерную форму многих двумерных облаков точек.
Это портреты двумерного нормального распределения с ковариационной матрицей Это модель для данных с коэффициентом корреляции .Σ=(1−23−231).−2/3
Как создавать эллипсы
Эллипс - в соответствии с его самым старым определением - это коническое сечение, представляющее собой круг, искаженный проекцией на другую плоскость. Рассматривая природу проекции, так же как и визуальные художники, мы можем разложить ее на последовательность искажений, которые легко понять и рассчитать.
Сначала растяните (или, если необходимо, сожмите) окружность вдоль того, что станет длинной осью эллипса, пока она не станет правильной длины:
Затем сожмите (или вытяните) этот эллипс вдоль его малой оси:
В-третьих, поверните его вокруг его центра в его окончательную ориентацию:
Наконец, переместите его в нужное место:
Это все аффинные преобразования. (Фактически, первые три являются линейными преобразованиями ; последний сдвиг делает их аффинными.) Поскольку композиция аффинных преобразований (по определению) все еще аффинна, чистое искажение от круга к конечному эллипсу является аффинным преобразованием. Но это может быть несколько сложно:
Обратите внимание, что случилось с (естественными) осями эллипса: после того, как они были созданы смещением и сжатием, они (конечно) вращались и смещались вместе с самой осью. Мы легко видим эти оси, даже если они не нарисованы, потому что они являются осями симметрии самого эллипса.
Мы хотели бы применить наше понимание эллипсов к пониманию искаженных циркулярно-симметричных распределений, таких как двумерное нормальное семейство. К сожалению, есть проблема с этими искажениями : они не учитывают различия между осями иВращение на шаге 3 разрушает это. Посмотрите на слабые координатные сетки на заднем плане: они показывают, что происходит с сеткой (сеткиxy1/2в обоих направлениях) когда оно искажено. На первом изображении расстояние между исходными вертикальными линиями (показано сплошным) удваивается. На втором изображении расстояние между исходными горизонтальными линиями (показано пунктирной линией) сокращено на треть. На третьем изображении интервалы сетки не изменены, но все линии повернуты. Они сдвигаются вверх и вправо на четвертом изображении. Окончательное изображение, показывающее чистый результат, отображает эту растянутую, сжатую, повернутую, смещенную сетку. Исходные сплошные линии с постоянной координатой больше не являются вертикальными.x
Идея ключа --one может рискнет сказать , что это суть регрессии - это то , что есть способ , в котором круг может быть искажен в эллипс без поворота вертикальных линий . Поскольку вращение было виновником, давайте перейдем к преследованию и покажем, как создать вращаемый эллипс, фактически не вращаясь !
Это перекос трансформации. На самом деле он делает две вещи одновременно:
Он выжимает в направлении (на величину , скажем). Это оставляет ось покое.yλx
Он поднимает любую результирующую точку на величину, прямо пропорциональную . Записывая эту константу пропорциональности как , это отправляет в .(x,y)xρ(x,y)(x,y+ρx)
Второй шаг поднимает ось в линию , показанную на предыдущем рисунке. Как показано на этом рисунке, я хочу работать со специальным перекосом, который эффективно поворачивает эллипс на 45 градусов и вписывает его в единицу площади. Главной осью этого эллипса является линия . Наглядно видно, что . (Отрицательные значения наклоняют эллипс вправо, а не вправо.) Это геометрическое объяснение «регрессии к среднему».xy=ρxy=x|ρ|≤1ρ
Выбор угла в 45 градусов делает эллипс симметричным относительно диагонали квадрата (часть линии ). Чтобы выяснить параметры этого перекоса, соблюдайте:y=x
Подъем на перемещает точкуρx(1,0)(1,ρ)
(ρ,1)
Где этот пункт начался?
x2+y2=1xρ(ρ,1−ρ2−−−−−√)
(ρ,y)(ρ,λy)(ρ,λy+ρ×ρ)
(ρ,λ1−ρ2−−−−−√+ρ2)=(ρ,1)λ=1−ρ2−−−−−√ρ
ρ0, 3/10, 6/10,9/10,
ρ
заявка
Мы готовы сделать регресс. Стандартный, элегантный (но простой) метод для выполнения регрессии - это прежде всего выражение исходных переменных в новых единицах измерения: мы центрируем их по их средним значениям и используем их стандартные отклонения в качестве единиц измерения. Это перемещает центр распределения в начало координат и делает все его эллиптические контуры наклонными на 45 градусов (вверх или вниз).
x0x0y1−ρ2−−−−−√ρxρxx
xy=ρx
x
Мы можем легко сказать больше:
1x1−ρ2
ρΣXYXYXY(X,Y)
ε=Y−ρX
ε0Y0ρXρX
xρ=−1/2
вследствие этого
E(XY)=E(X(ρX+ε))=ρE(X2)+E(Xε)=ρ(1)+0=ρ.
X1XεX(−ε)ε0
ρXY
Выводы
x(X,Y)xyμxμyσxσy
(μx,μy)
{(x,ρx)},
ρσyρ/σx
Следовательно, уравнение линии регрессии
y=σyρσx(x−μx)+μy.
- Y|Xσ2y(1−ρ2)Y′|X′(X′,Y′)X′=(X−μX)/σxY′=(Y−μY)/σY
Y′|X′1
- Σσ11=σ2x, σ12=σ21=ρσxσy,σ22=σ2y,Y|X
σ2y(1−ρ2)=σ22(1−(σ12σ11σ22−−−−−√)2)=σ22−σ212σ11.
Технические примечания
y
(1ρρ1)=AA′
где
A=(1ρ01−ρ2−−−−−√).
Намного лучше известен квадратный корень, который описан вначале (с вращением вместо перекоса); это тот, который создается разложением по единственному значению, и он играет важную роль в анализе главных компонентов (PCA):
(1ρρ1)=BB′;
B=Q(ρ+1−−−−√001−ρ−−−−√)Q′
Q=⎛⎝12√12√−12√12√⎞⎠45
Таким образом, различие между PCA и регрессией сводится к разнице между двумя особыми квадратными корнями матрицы корреляции.