Корреляция между X и XY


11

Если у меня есть две независимые случайные величины X и Y, какова корреляция между X и произведением XY? Если это неизвестно, мне было бы интересно узнать, по крайней мере, что происходит в конкретном случае, когда X и Y нормальны с нулевым средним, если это легче решить.


4
Что мотивирует этот вопрос? Интересно, будет ли лучше, если мы также рассмотрим здесь что-то еще? Проводите ли вы исследование, в котором по какой-то причине вы создали переменную XY?
gung - Восстановить Монику

Ответы:


13

Решение

Я считать, что правильное решение будет один , что экспрессы - если это возможно - корреляция с точки зрения отдельных свойств переменных и . Вычисление корреляции будет включать в себя вычисление ковариации одночленов в и . Это экономично, чтобы сделать это все сразу. Просто заметьте, чтоY X YXYXY

  1. Когда и независимы, а и являются степенями, то и независимы;Y i j X i Y jXYijXiYj

  2. Ожидание продукта независимых переменных является продуктом их ожиданий.

Это даст формулы в терминах моментов и .YXY

Это все, что нужно сделать.


подробности

Напишите и т. Д. Для моментов. Таким образом, для любых чисел для которых вычисления имеют смысл и дают конечные числа,i , j , k , lμi(X)=E(Xi)i,j,k,l

Cov(XiYj,XkYl)=E(XiYjXkYl)E(XiYj)E(XkYl)=μi+k(X)μj+l(Y)μi(X)μk(X)μj(Y)μl(Y).

Обратите внимание, что дисперсия любой случайной величины - это ее ковариация с самим собой, поэтому нам не нужно делать каких-либо специальных вычислений для дисперсий.

Теперь должно быть очевидно, как вычислять моменты с участием мономов любых степеней, любого конечного числа независимых случайных величин. В качестве приложения, примените этот результат к определению корреляции, которое представляет собой ковариацию, деленную на квадратные корни из дисперсий:

Cor(X,XY)=Cov(X1Y0,X1Y1)Cov(X1Y0,X1Y0) Cov(X1Y1,X1Y1)=μ2(X)μ1(Y)μ1(X)2μ1(Y)(μ2(X)μ1(X)2)(μ2(X)μ2(Y)μ1(X)2μ2(Y)2).

Существуют различные алгебраические упрощения, которые вы можете выбрать, если хотите связать это с ожиданиями, дисперсиями и ковариациями исходных переменных, но выполнение их здесь не даст больше понимания.


14

Используя закон полной ковариантности и независимости и , Используя закон полной дисперсии и снова независимость, Обратите внимание, какY Cov ( X , X Y )XY

Cov(X,XY)=ECov(X,XY|Y)+Cov(EX|Y,EXY|Y)=E(YCov(X,X))+Cov(EX,YEX)=E(YVarX)+Cov(EX,YEX)=EYVarX.
Var(XY)=EVar(XY|Y)+VarE(XY|Y)=E(Y2(VarX|Y))+Var(Y(EX|Y))=E(Y2VarX)+Var(YEX)=E(Y2)VarX+(EX)2VarY=VarXVarY+(EY)2VarX+(EX)2VarY.
Y может рассматриваться как константа в любом из указанных выше внутренних условных ожиданий, дисперсий или ковариаций.

Исходя из вышеуказанной ковариации и дисперсии, корреляция после некоторых алгебраических манипуляций может быть хорошо выражена в терминах двух коэффициентов вариации как

corr(X,XY)=11+VarY(EY)2(1+(EX)2VarX).

Проверка этого результата с помощью симуляции:

> n <- 1e+6
> x <- rexp(n,2)-2
> y <- rnorm(n,mean=5)
> cv2 <- function(x) var(x)/mean(x)^2
> 1/sqrt(1+cv2(y)*(1+1/cv2(x)))
[1] 0.844882
> cor(x,x*y)
[1] 0.8445373

Хорошо, но я хотел бы отметить несколько вещей: 1. В третьей строке второго набора уравнений должна быть скобка, как в ? 2. Вы уверены, что человек, который задал вопрос, следует рассуждениям за различными шагами? Например, что так, потому что является данным. Я бы предложил минимальное объяснение некоторых шагов. E(Y2VarX)+Var(YEX)ECov(X,XY|Y)=EYCov(X,X)Y
Антони Пареллада

1
Да, я добавил несколько пропущенных скобок и объяснение. Я должен признать, что предпочитаю ответ @whuber, хотя.
Ярле Туфто

5

В конкретном случае, когда X и Y являются случайными переменными с нулевым средним, то потому что . Следовательно,ρ(XY,X)=0E(X2Y)=E[E[X2Y|X]]=E[X2E[Y|X]]=0cov(XY,X)=E(X2Y)E(XY).E(X)=0


-2

Линейная корреляция между X и XY будет,

Corr (X, XY) = Cov (X, XY) / sqrt (var (X) * var (XY))

Cov (X, XY) = Суммирование ((X-среднее (X)) (XY-среднее (XY)) / n

n - размер выборки; var (X) = дисперсия X; var (XY) = дисперсия XY


1
Вопрос о случайных переменных , а не о данных.
whuber

Как мы можем определить, коррелированы ли 2 случайные величины или нет? Через данные только право. Поправьте меня если я ошибаюсь. Извиняюсь.
Сэм Гладио

Корреляцию вычисляют теоретически, используя математические свойства случайных величин. Это почти то же самое, что, скажем, вычисление прочности конструкции моста с использованием принципов ньютоновской механики по сравнению со строительством мостов и их проверка: существуют разные роли для теории и данных, и их не следует путать друг с другом. ,
whuber
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.