Заполнение матрицы корреляции 3x3: два коэффициента из трех данных


20

Мне задали этот вопрос в интервью.

Допустим, у нас есть корреляционная матрица вида

[10.60.80.61γ0.8γ1]

Меня попросили найти значение гаммы, учитывая эту матрицу корреляции.
Я думал, что мог бы что-то сделать с собственными значениями, поскольку все они должны быть больше или равны 0. (Матрица должна быть положительной полуопределенной) - но я не думаю, что этот подход даст ответ. Мне не хватает трюка.

Не могли бы вы дать подсказку, чтобы решить для того же?


Комментарии не для расширенного обсуждения; этот разговор был перенесен в чат .
whuber

1
Поиск этого сайта привел непосредственно к одной из (нескольких) тем, содержащих соответствующие формулы: stats.stackexchange.com/questions/5747 . Есть также некоторые полезные участки в ответе Феликс s .
whuber

Ответы:


21

Мы уже знаем, что ограничена между [ - 1 , 1 ] . Матрица корреляции должна быть положительной полуопределенной, и, следовательно, ее главные миноры должны быть неотрицательнымиγ[-1,1]

Таким образом,

1(1γ2)0.6(0.60.8γ)+0.8(0.6γ0.8)0γ2+0.96γ0γ(γ0.96)0 and 1γ10γ0.96

4
@novice Вы, возможно, захотите прочитать о Критерии Сильвестра
права искал

Отличный ответ. Я хотел бы добавить следующее: Популярный способ получения гаммы - попытка найти гамму, которая привела бы к матрице корреляции наименьшей ядерной нормы (иначе называемой нормой ky-fan) при решении приведенных выше уравнений. Для получения дополнительной информации ищите «завершение матрицы», «определение сжатия» или ознакомьтесь с этим отчетом по теме bit.ly/2iwY1nW .
Мустафа С Эйса

1
Чтобы это было доказательством, вам нужен результат в другом направлении: если все нетривиальные старшие миноры и матрица имеет определитель 0 , то матрица положительна полуопределена. >00
Федерико Полони

10

Вот более простое (и, возможно, более интуитивное) решение:

Думайте о ковариации как о внутреннем произведении абстрактного векторного пространства . Затем записи в корреляционной матрицы для векторов v 1 , v 2 , v 3 , где угловые скобки v я , v J обозначает угол между V я и об J .cosvi,vjv1v2v3vi,vjvivj

Не трудно представить , что ограничена | V 1 , v 2 ⟩ & plusmn ; v 1 , v 3| , Граница его косинуса ( γ ), таким образом , потому [об 1 , v 2 ⟩ & plusmn ; v 1 , v 3] . Основная тригонометрия тогда дает γ [ 0.6 ×v2,v3|v1,v2±v1,v3|γcos[v1,v2±v1,v3] .γ[0.6×0.8-0.6×0.8,0.6×0.8+0.6×0.8]знак равно[0,0,96]

Изменить: Обратите внимание , что в последней строке действительно соз v 1 , v 2соз v 1 , v 3грех v 1 , v 3грех v 1 , v 2 - второе появление 0,6 и 0,8 происходит по совпадению благодаря 0,6 2 + 0,8 2 = 10.6×0.80.6×0.8cosv1,v2cosv1,v3sinv1,v3sinv1,v20.62+0.82=1,


1
+1, законные геометрические рассуждения (тем не менее, я не проверял ваши вычисления). Это именно то, что я предложил в комментариях к вопросу (к сожалению, все комментарии были перенесены модератором в чат, см. Ссылку выше).
ttnphns

Мне кажется, что вы «доказали», что все корреляции должны быть неотрицательными, потому что кажется, что ваш расчет всегда будет давать ноль для нижнего предела. Если это не так, то не могли бы вы рассказать о том, как в целом работают ваши вычисления? Я действительно не доверяю - или, возможно, не понимаю - вашей границы, потому что в трех или более измерениях вы всегда можете найти для которого оба v 1v 2 = v 1v 3 = 0, а затем Ваша оценка подразумевает, что v 2v 3 всегда равно нулю! (cc @ttnphns)v1v1v2=v1v3=0v2v3
whuber

@whuber: Извините за путаницу. Расчет не всегда дает ноль для нижнего предела. Я исправил свой ответ.
Yangle

Как вы реагируете на мое последнее беспокойство? Похоже, что ваши оценки неверны.
whuber

@whuber: В вашем случае ⟨v1, v2⟩ = ⟨v1, v3⟩ = π / 2, следовательно, оценка | 1v1, v2⟩ ± ⟨v1, v3⟩ | [0, π], как и ожидалось. Оценка cos⟨v1, v2⟩cos⟨v1, v3⟩∓sin⟨v1, v3⟩sin⟨v1, v2⟩ на γ также оказывается равной [-1, 1].
Yangle

4

Here is what I meant in my initial comment to the answer and what I perceive @yangle may be speaking about (although I didn't follow/check their computation).

«Матрица должна быть положительной полуопределенной» означает, что переменные векторы представляют собой сгусток в евклидовом пространстве. Случай с корреляционной матрицей проще, чем с ковариационной матрицей, поскольку три длины вектора фиксированы и равны 1. Представьте себе 3 единичных вектора XYZ и помните, что является косинусом угла . Итак, cos α = r x y = 0,6 и cos β = r y z = 0,8 . Каковы могут быть границы для cos γ = r x zrcosα=rxy=0.6cosβ=ryz=0.8cosγ=rxz? That correlation can take on any value defined by Z circumscribing about Y (keeping angle ryz=0.8 with it):

enter image description here

As it spins, two positions are remarkable as ultimate wrt X, both are when Z falls into the plane XY. One is between X and Y, and the other is on the opposite side of Y. These are shown by blue and red vectors. At both these positions exactly the configuration XYZ (correlation matrix) is singular. And these are the minimal and maximal angle (hence correlation) Z can attain wrt X.

Picking the trigonometric formula to compute sum or difference of angles on a plane, we have:

cosγ=rxyryz(1rxy2)(1ryz2)=[0,0.96] as the bounds.

This geometric view is just another (and a specific and simpler in 3D case) look on what @rightskewed expressed in algebraic terms (minors etc.).


If X,Y,Z are random variables, how do you map them to vectors in 3d space (They can only be vectors in 1d space). Also if the RV's are Nx1, then they will be vectors in N dimensional space?
novice

@novice Yes, they are initially 3 vectors in Nd space, but only 3 dimensions are nonredundant. Please follow the 2nd link in the answer and read further reference there to subject space where it is explained.
ttnphns

4

Playing around with principal minors may be fine on 3 by 3 or maybe 4 by 4 problems, but runs out of gas and numerical stability in higher dimensions.

Для одной проблемы «свободного» параметра, такой как эта, легко видеть, что набор всех значений, составляющих матрицу psd, будет одним интервалом. Поэтому достаточно найти минимальные и максимальные такие значения. Это может быть легко достигнуто путем численного решения пары задач линейного полуопределенного программирования (SDP):

  1. свести к минимуму γ с учетом матрицы PSD.
  2. максимизировать γ с учетом матрицы PSD.

Например, эти проблемы могут быть сформулированы и численно решены с использованием YALMIP под MATLAB.

  1. гамма = сдпвар; A = [1, 6, 8; .6 1 гамма; .8 гамма 1]; оптимизировать (A> = 0, гамма)
  2. оптимизировать (A> = 0, -гамма)

Быстро, просто и надежно.

BTW, if the smarty pants interviewer asking the question doesn't know that SemiDefinite Programming, which is well-developed and has sophisticated and easy to use numerical optimizers for reliably solving practical problems, can be used to solve this problem, and many much more difficult variants, tell him/her that this is no longer 1870, and it's time to take advantage of modern computational developments.


4

Let us consider the following convex set

{(x,y,z)R3:[1xyx1zyz1]O3}

which is a spectrahedron named 3-dimensional elliptope. Here's a depiction of this elliptope

enter image description here

Intersecting this elliptope with the planes defined by x=0.6 and by y=0.8, we obtain a line segment whose endpoints are colored in yellow

enter image description here

The boundary of the elliptope is a cubic surface defined by

det[1xyx1zyz1]=1+2xyzx2y2z2=0

If x=0.6 and y=0.8, then the cubic equation above boils down to the quadratic equation

0,96Z-Z2знак равноZ(0,96-Z)знак равно0

Таким образом, пересечение эллиптопа с двумя плоскостями является отрезком прямой, параметризованным

{(0.6,0.8,T)|0T0,96}

1

Каждая положительная полуопределенная матрица является матрицей корреляции / ковариации (и наоборот).

Чтобы увидеть это, начните с положительной полуопределенной матрицы A и принять его собственное разложение (которое существует по спектральной теореме, так как A симметрично) Aзнак равноUDUТ где U является матрицей ортонормированных собственных векторов и D is a diagonal matrix with eigen values on the diagonal. Then, let B=UD1/2UT where D1/2 is a diagonal matrix with the square root of eignevalues on the diagonal.

Then, take a vector with i.i.d. mean zero and variance 1 entries, x and note that Bx also has mean zero, and covariance (and correlation) matrix A.

Now, to see every correlation/covariance matrix is positive semi-definite is simple: Let R=E[xxT] be a correlation matrix. Then, R=RT is easy to see, and aTRa=E[(aTx)2]0 so the Rayleigh quotient is non-negative for any non-zero a so R is positive semi-definite.

Now, noting that a symmetric matrix is positive semi-definite if and only if its eigenvalues are non-negative, we see that your original approach would work: calculate the characteristic polynomial, look at its roots to see if they are non-negative. Note that testing for positive definiteness is easy with Sylvester's Criterion (as mentioned in another answer's comment; a matrix is positive definite if and only if the principal minors all have positive determinant); there are extensions for semidefinite (all minors have non-negative determinant), but you have to check 2n minors in this case, versus just n for positive definite.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.