Объединение двух ковариационных матриц


11

Я вычисляю ковариацию распределения параллельно, и мне нужно объединить распределенные результаты в единственном гауссовском. Как мне совместить два?

Линейная интерполяция между двумя почти работами, если они одинаково распределены и измерены.

В Википедии внизу есть форумла для комбинации, но она кажется неправильной; два одинаково распределенных распределения должны иметь одинаковую ковариацию, но формула внизу страницы удваивает ковариацию.

Есть ли способ объединить две матрицы?


3
Формула Википедии отвечает на ваш вопрос, Мэтт: вы, возможно, не заметили, что это частичная формула, после которой вам нужно разделить размер выборки.
whuber

1
Я понял это сейчас, с вашей помощью - если вы включите это в ответ, я отмечу это как ответ.
Мэтт Кемп

Ответы:


12

Этот вопрос часто возникает в разных ипостасях. Что для них общего

Как я могу объединить статистику на основе моментов, которая была вычислена из непересекающихся подмножеств моих данных?

Самое простое приложение касается данных, которые были разделены на две группы. Вы знаете размеры группы и групповые средства. С точки зрения только этих четырех величин, каково общее значение данных?

Другие приложения обобщают от среднего значения до дисперсии, стандартных отклонений, ковариационных матриц, асимметрии и многомерной статистики; и может включать несколько подгрупп данных. Обратите внимание, что многие из этих величин представляют собой несколько сложные комбинации моментов: например, стандартное отклонение представляет собой квадратный корень из квадратичной комбинации первого и второго моментов (среднего и среднего квадрата).

Все такие случаи легко обрабатываются путем уменьшения различных моментов до сумм, потому что суммы очевидно и легко объединяются: они складываются. Математически все сводится к следующему: у вас есть пакет данных , которые были разделены на непересекающиеся группы размеров j 1 , j 2 , , j g : ( x 1 , x 2 , , x j 1 ;X=(x1,x2,,xn)j1,j2,,jg . Назовем i- ю группу X ( i ) = ( x j i + 1 , x j i + 2 , , x j i(x1,x2,,xj1;xj1+1,,xj1+j2;xj1+j2+1,;;,xn)i. По определению,k-ймоментлюбой партии данныхy1,,yjявляется средним значениемk-й степени,X(i)=(xji+1,xji+2,,xji+1)ky1,,yjk

μk(y)=(y1k+y2k++yjk)/j.

jμk(y)kgn

nμk(X)=(x1k+x2k++xnk)=(x1k+x2k++xj1k)++(xj1++jg1+1k+xj1++jg1+2k++xnk)=j1μk(X(1))+j2μk(X(2))++jgμk(X(g)).

nkk

xy

((x1,y1),(x2,y2),,(xn,yn)),

gxiyi(1,1)μ(1,1)n

n1nn1ji1nji


n


Я немного запутался в определении k-го момента. Вы предполагаете данные с нулевым средним?
Решу

kth

Плохо может! Я смешивал «центральные» и «сырые» моменты. Спасибо за разъяснение!
Решу

Я думаю, что «знать средства размеров подгрупп» в предпоследнем абзаце следует читать «знать средства подгрупп» вместо этого? (Я не решаюсь отредактировать это самостоятельно, так как не удосужился внимательно изучить ответ)
Юхо Коккала

@Juho Вы совершенно правы. Спасибо, что заметили это!
whuber
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.