Я думаю, что ответ должен быть да, но я все еще чувствую, что-то не так. В литературе должны быть общие результаты, кто-нибудь может мне помочь?
Я думаю, что ответ должен быть да, но я все еще чувствую, что-то не так. В литературе должны быть общие результаты, кто-нибудь может мне помочь?
Ответы:
Нет.
Рассмотрим три переменные, , Y и Z = X + Y . Их ковариационная матрица M не является положительно определенной, поскольку существует вектор z ( = ( 1 , 1 , - 1 ) ′ ), для которого z ′ M z не является положительным.
Ковариационные матрицы популяции являются положительными полуопределенными.
(См. Свойство 2 здесь .)
То же самое в целом должно применяться к ковариационным матрицам полных выборок (без пропущенных значений), поскольку их также можно рассматривать как форму дискретной ковариации населения.
Однако из-за неточности числовых вычислений с плавающей точкой даже алгебраически положительно определенные случаи могут иногда вычисляться, чтобы не быть даже положительно полуопределенными; хороший выбор алгоритмов может помочь с этим.
В более общем смысле, выборочные ковариационные матрицы - в зависимости от того, как они справляются с отсутствующими значениями в некоторых переменных - могут быть или не быть положительными полуопределенными, даже в теории. Например, если используется попарное удаление, то нет гарантии положительной полуопределенности. Кроме того, накопленная числовая ошибка может привести к тому, что выборочные ковариационные матрицы, которые должны быть условно положительными, полуопределенными, могут быть неверными.
Вот так:
x <- rnorm(30)
y <- rnorm(30) - x/10 # it doesn't matter for this if x and y are correlated or not
z <- x+y
M <- cov(data.frame(x=x,y=y,z=z))
z <- rbind(1,1,-1)
t(z)%*%M%*%z
[,1]
[1,] -1.110223e-16
Это произошло в первом примере, который я попробовал (я, вероятно, должен предоставить семя, но не так уж и редко, что вам нужно попробовать много примеров, прежде чем вы его получите).
Результат получился отрицательным , хотя он должен быть алгебраически нулевым. Другой набор чисел может дать положительное число или «точный» ноль.
-
Пример умеренного отсутствия, приводящего к потере положительной полуопределенности посредством парного удаления:
z <- x + y + rnorm(30)/50 # same x and y as before.
xyz1 <- data.frame(x=x,y=y,z=z) # high correlation but definitely of full rank
xyz1$x[sample(1:30,5)] <- NA # make 5 x's missing
xyz1$y[sample(1:30,5)] <- NA # make 5 y's missing
xyz1$z[sample(1:30,5)] <- NA # make 5 z's missing
cov(xyz1,use="pairwise") # the individual pairwise covars are fine ...
x y z
x 1.2107760 -0.2552947 1.255868
y -0.2552947 1.2728156 1.037446
z 1.2558683 1.0374456 2.367978
chol(cov(xyz1,use="pairwise")) # ... but leave the matrix not positive semi-definite
Error in chol.default(cov(xyz1, use = "pairwise")) :
the leading minor of order 3 is not positive definite
chol(cov(xyz1,use="complete")) # but deleting even more rows leaves it PSD
x y z
x 0.8760209 -0.2253484 0.64303448
y 0.0000000 1.1088741 1.11270078
z 0.0000000 0.0000000 0.01345364