Во-первых, вы получаете среднее значение ноль, вычитая среднее значение .μ=1N∑x
Во-вторых, вы получаете нулевые ковариации, выполняя PCA. Если является ковариационной матрицей ваших данных, то PCA сводится к выполнению собственного разложения Σ = U Λ U ⊤ , где U - матрица ортогонального вращения, состоящая из собственных векторов Σ , а Λ - диагональная матрица с собственными значениями на диагонали. Матрица U ⊤ дает поворот, необходимый для декорреляции данных (т. Е. Сопоставляет исходные элементы с основными компонентами).ΣΣ=UΛU⊤UΣΛU⊤
В-третьих, после поворота каждый компонент будет иметь дисперсию, заданную соответствующим собственным значением. Таким образом, чтобы сделать дисперсию равной , вам нужно разделить на квадратный корень из Λ .1Λ
Все вместе, отбеливающий преобразование . Вы можете открыть скобки, чтобы получить форму, которую вы ищете.x↦Λ−1/2U⊤(x−μ)
Обновить. См. Также эту более позднюю ветку для более подробной информации: В чем разница между отбеливанием ZCA и отбеливанием PCA?