Во-первых, я считаю, что устранение корреляции и отбеливание - это две отдельные процедуры.
Для того чтобы декоррелировать данные, нам необходимо преобразовать их так, чтобы преобразованные данные имели диагональную ковариационную матрицу. Это преобразование может быть найдено путем решения проблемы собственных значений. Найдем собственные векторы и связанные с ними собственные значения ковариационной матрицы , решивΣ = X X'
Σ Φ = Φ Λ
где - диагональная матрица, имеющая собственные значения в качестве своих диагональных элементов.Λ
Матрица Таким образом , диагонализует ковариационная матрица X . Столбцы Φ являются собственными векторами ковариационной матрицы.ΦИксΦ
Мы также можем написать диагонализованную ковариацию как:
Φ'Σ Φ = Λ(1)
Икся
Икс*я= Φ'Икся(2)
Λ
Λ- 1 / 2Λ Λ- 1 / 2= Я
( 1 )
Λ- 1 / 2Φ'Σ Φ Λ- 1 / 2= Я
Икс*яИкс†я
Икс†я= Λ- 1 / 2Икс*я= Λ- 1 / 2Φ'Икся(3)
Икс†яИкс†яЕ ( х†яИкс†я') = Я
Σ
И, наконец, есть общая «ошибка», о которой люди должны быть осторожны. Нужно быть осторожным, чтобы вы вычислили коэффициенты масштабирования для данных обучения , а затем использовали уравнения (2) и (3), чтобы применить те же коэффициенты масштабирования к тестовым данным, в противном случае вы рискуете переобучиться (вы будете использовать информация из теста, установленного в тренировочном процессе).
Источник: http://courses.media.mit.edu/2010fall/mas622j/whiten.pdf