Как отбелить данные с помощью анализа основных компонентов?

Я хочу преобразовать свои данные так, чтобы отклонения были равны единице, а ковариации были равны нулю (т.е. я хочу отбелить данные). Кроме того, средства должны быть нулевыми. $\mathbf X$

Я знаю, что доберусь туда, выполнив Z-стандартизацию и PCA-преобразование, но в каком порядке я должен их делать?

Следует добавить, что составное отбеливающее преобразование должно иметь вид $\mathbf{x} \mapsto W\mathbf{x} + \mathbf{b}$ .

Есть ли метод, похожий на PCA, который выполняет именно эти преобразования и дает мне формулу в форме выше?

pca linear-algebra

— Angelorf
источник

(Мой первый комментарий был основан на неправильном прочтении вашего вопроса.) PCA дает вам нулевые ковариации; Вы можете стандартизировать ПК впоследствии, если хотите. Это звучит странно, но вы можете это сделать.

— Ник Кокс

@NickCox Может быть, это кажется странным, потому что преобразованные данные тогда являются сферическими, что кажется неинформативным. Тем не менее, это трансформация, которую я должен знать, а не конечный результат. Тем не менее я не знаю, как будет выглядеть трансформация. Я все еще читаю о PCA, все же.

— Angelorf

Во-первых, вы получаете среднее значение ноль, вычитая среднее значение . $\boldsymbol \mu = \frac{1}{N}\sum \mathbf{x}$

Во-вторых, вы получаете нулевые ковариации, выполняя PCA. Если является ковариационной матрицей ваших данных, то PCA сводится к выполнению собственного разложения , где - матрица ортогонального вращения, состоящая из собственных векторов , а - диагональная матрица с собственными значениями на диагонали. Матрица дает поворот, необходимый для данных (т. исходные элементы с основными компонентами). $\boldsymbol \Sigma$ $\boldsymbol \Sigma = \mathbf{U} \boldsymbol \Lambda \mathbf{U}^\top$ $\mathbf{U}$ $\boldsymbol \Sigma$ $\boldsymbol \Lambda$ $\mathbf{U}^\top$

В-третьих, после поворота каждый компонент будет иметь дисперсию, заданную соответствующим собственным значением. Таким образом, чтобы сделать дисперсию равной , вам нужно разделить на квадратный корень из . $1$ $\boldsymbol \Lambda$

Все вместе, отбеливающий преобразование . Вы можете открыть скобки, чтобы получить форму, которую вы ищете. $\mathbf{x} \mapsto \boldsymbol \Lambda^{-1/2} \mathbf{U}^\top (\mathbf{x} - \boldsymbol \mu)$

Обновить. См. Также эту более позднюю ветку для более подробной информации: В чем разница между отбеливанием ZCA и отбеливанием PCA?

— амеба говорит восстановить монику
источник

Я думаю, что вам нужно делить на квадратные корни из собственных значений, так как это вопрос масштабирования по SD, а не дисперсии.

— Ник Кокс

@NickCox: да, конечно, вы правы. Я исправил свой ответ. Спасибо!

— говорит амеба: восстанови Монику

Я эмпирически проверил формулу. Спасибо за помощь!

— Angelorf