Интуиция за формулой для дисперсии суммы двух переменных


10

Я знаю из предыдущих исследований, что

Вaр(A+В)знак равноВaр(A)+Вaр(В)+2Соv(A,В)

Однако я не понимаю, почему это так. Я вижу, что эффект будет «увеличивать» дисперсию, когда А и В сильно коваризуются. Имеет смысл, что, когда вы создаете композит из двух сильно коррелированных переменных, вы будете склонны добавлять высокие наблюдения из А с высокими наблюдениями из В, и низкие наблюдения из А с низкими наблюдениями из В. Это будет иметь тенденцию к создавать экстремальные высокие и низкие значения в составной переменной, увеличивая дисперсию составного.

Но почему работает умножение ковариации ровно на 2?


1
Если и B полностью положительно коррелированы, то V a r ( A + B ) = V a r ( A ) + V a r ( B ) + 2 AВ и если они совершенно отрицательно коррелированы, тоVar(A+B)=Var(A)+Var(B)-2Var(A+B)=Var(A)+Var(B)+2Var(A)Var(B) . Ковариация измеряет, насколько далеко в этом диапазоне находятся их отношенияVar(A+B)=Var(A)+Var(B)2Var(A)Var(B)
Генри

Ответы:


21

Простой ответ:

Дисперсия включает в себя квадрат:

Вaр(Икс)знак равноЕ[(Икс-Е[Икс])2]

Итак, ваш вопрос сводится к коэффициенту 2 в квадратной идентичности:

(a+б)2знак равноa2+б2+2aб

Что можно понимать визуально как разложение площади квадрата стороны на область меньших квадратов сторон a и b , в дополнение к двум прямоугольникам сторон a и b :(a+б)aбaб

введите описание изображения здесь

Более сложный ответ:

Если вам нужен математически более сложный ответ, ковариация является билинейной формой, что означает, что она является линейной как в первом, так и во втором аргументах, это приводит к:

Var(A+B)=Cov(A+B,A+B)=Cov(A,A+B)+Cov(B,A+B)=Cov(A,A)+Cov(A,B)+Cov(B,A)+Cov(B,B)=Var(A)+2Cov(A,B)+Var(B)

В последней строке я использовал тот факт, что ковариация симметрична:

Cov(A,B)=Cov(B,A)

Подводить итоги:

Это два, потому что вы должны учитывать как и c o v ( B , A ) .cov(A,B)cov(B,A)


5

Множество случайных величин является векторным пространством, и многие свойства евклидова пространства могут быть им аналогичны. Стандартное отклонение действует как длина, а дисперсия - как квадрат длины. Независимость соответствует ортогональности, а идеальная корреляция соответствует скалярному умножению. Таким образом, дисперсия независимых переменных следует теореме Пифагора:
.vaр(A+В)знак равноvaр(A)+vaр(В)

Если они идеально коррелированы, то
sTd(A+В)знак равноsTd(A)+sTd(В)


var(A+B)=var(A)+var(B)+2var(A)var(B)


var(A+B)=var(A)+var(B)+2cov(A,B)

ABcov(A,B)var(A,B) always has a var(A) term and a var(B) term, and then it has some variation on the 2var(A)var(B) term; the more correlated the variables are, the larger this third term will be. And this is precisely what 2cov(A,B) is: it's 2var(A)var(B) times the r2 of A and B.

var(A+B)=var(A)+var(B)+MeasureOfCorrelationPerfectCorrelationTerm

where MeasureOfCorrelation=r2 and PerfectCorrelationTerm=2var(A)var(B)

Put in other terms, if r=correl(A,B), then

σA+B=σA2+σB2+2(rσA)(rσB)

Thus, r2 is analogous to the cos in the Law of Cosines.


2

Я хотел бы добавить , что то , что вы цитируетесь не определение изВaр(A+В), а скорее следствием определенийВaр а также Соv, Таким образом, ответ на вопрос, почему выполняется это уравнение, - это расчет, выполненный byessess . Ваш вопрос действительно может быть, почему это имеет смысл; неформально:

Как много A+В будет «меняться», зависит от четырех факторов:

  1. Как много A будет меняться сам по себе.
  2. Как много В будет меняться сам по себе.
  3. Как много A будет меняться как В перемещается (или меняется).
  4. Как много В будет меняться как A двигается

Что приводит нас к

Вaр(A+В)знак равноВaр(A)+Вaр(В)+Соv(A,В)+Соv(В,A)
знак равноВaр(A)+Вaр(В)+2Соv(A,В)
потому что Соv является симметричным оператором.
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.