Проблема с вашей линией рассуждений
«Я думаю, что мы всегда можем предположить, что X независим от других X ».
не зависит от X . Символ X используется здесь для обозначения той же случайной величины. Как только вы узнаете значение первого X, которое появится в вашей формуле, это также исправит значение второго X, которое должно появиться. Если вы хотите, чтобы они ссылались на разные (и потенциально независимые) случайные величины, вам нужно обозначить их разными буквами (например, X и Y ) или использовать индексы (например, X 1 и X 2 ); последний часто (но не всегда) используется для обозначения переменных, взятых из одного и того же распределения.XXXXXXYX1X2
XYPr ( X = a ) Y X Pr ( X = a | X = b ) 1 a = b 0 X XPr(X=a|Y=b)Pr(X=a)YXPr(X=a|X=b)1a=b0XX
Другой способ видеть вещи в том , что если две переменные независимы , то они имеют нулевую корреляцию (хотя нулевая корреляция не означает независимость !) , Но является вполне коррелируют с собой, , так не может быть независимо от себя. Обратите внимание, что поскольку ковариация определяется как , тоCorr ( X , X ) = 1 X Cov ( X , Y ) = Corr ( X , Y ) √XCorr(X,X)=1X Cov(X,X)=1 √Cov(X,Y)=Corr(X,Y)Var(X)Var(Y)−−−−−−−−−−−−√
Cov(X,X)=1Var(X)2−−−−−−−√=Var(X)
Более общая формула для дисперсии суммы двух случайных величин
Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)
В частности, , поэтомуCov(X,X)=Var(X)
Var(X+X)=Var(X)+Var(X)+2Var(X)=4Var(X)
что так же, как вы могли бы вывести из применения правила
Var(aX)=a2Var(X)⟹Var(2X)=4Var(X)
Если вас интересует линейность, то вас может заинтересовать билинейность ковариации. Для случайных величин , , и (зависимых или независимых) и постоянных , , и мы имеемX Y Z a b c dWXYZabcd
Cov(aW+bX,Y)=aCov(W,Y)+bCov(X,Y)
Cov(X,cY+dZ)=cCov(X,Y)+dCov(X,Z)
и в целом,
Cov(aW+bX,cY+dZ)=acCov(W,Y)+adCov(W,Z)+bcCov(X,Y)+bdCov(X,Z)
Затем вы можете использовать это, чтобы доказать (нелинейные) результаты для дисперсии, которые вы написали в своем посте:
Var(aX)=Cov(aX,aX)=a2Cov(X,X)=a2Var(X)
Var(aX+bY)Var(aX+bY)=Cov(aX+bY,aX+bY)=a2Cov(X,X)+abCov(X,Y)+baCov(X,Y)+b2Cov(Y,Y)=a2Var(X)+b2Var(Y)+2abCov(X,Y)
Последнее дает, как частный случай, когда ,a=b=1
Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)
Когда и некоррелированы (что включает случай, когда они независимы), тогда это сводится к . Поэтому, если вы хотите манипулировать отклонениями «линейным» способом (который часто является хорошим способом алгебраической работы), тогда вместо этого работайте с ковариациями и используйте их билинейность.Y Var ( X + Y ) = Var ( X ) + Var ( Y )XYVar(X+Y)=Var(X)+Var(Y)