Не пытаясь дать полное представление о PCA, с точки зрения оптимизации, основной целевой функцией является коэффициент Рэлея . Матрица, которая фигурирует в частном, является (несколько кратной) выборочной ковариационной матрицей
,
где каждый представляет собой вектор функций и является матрицей , так что й строки является .
S=1n∑i=1nxixTi=XTX/n
xipXixTi
PCA стремится решить ряд задач по оптимизации. Первой в последовательности является проблема без ограничений
maximizeuTSuuTu,u∈Rp.
Так какуказанная выше безусловная проблема эквивалентна ограниченной задаче
uTu=∥u∥22=∥u∥∥u∥
maximizesubject touTSuuTu=1.
Вот где вступает матричная алгебра. Поскольку - симметричная положительная полуопределенная матрица (по построению!), Она имеет разложение по собственным значениям вида
где - это ортогональная матрица (поэтому ) и - диагональная матрица с неотрицательными элементами такими что .S
S=QΛQT,
QQQT=IΛλiλ1≥λ2≥⋯≥λp≥0
Следовательно, . Поскольку ограничено в задаче одной единицей, то так же, как и , поскольку ортогонально.uTSu=uTQΛQTu=wTΛw=∑pi=1λiw2iuw∥w∥2=∥QTu∥2=∥u∥2=1Q
Но если мы хотим максимизировать количество при ограничениях, которые , то лучшее, что мы можем сделать, это set , то есть и для .∑pi=1λiw2i∑pi=1w2i=1w=e1w1=1wi=0i>1
Теперь, возвращаясь к соответствующему , что мы и искали, мы получаем
где обозначает первый столбец , то есть собственный вектор , соответствующий наибольшего собственного значения . Значение целевой функции также легко увидеть как .u
u⋆=Qe1=q1
q1QSλ1
Остальные векторы главных компонентов затем находят путем решения последовательности (индексируемой ) задач оптимизации
Итак, проблема та же, за исключением того, что мы добавили дополнительное ограничение, согласно которому решение должно быть ортогональным ко всем предыдущим решениям в последовательности. Это не трудно расширить аргумент выше индуктивно , чтобы показать , что решение - го проблема, на самом деле, , тем й собственный вектор .i
maximizesubject touTiSuiuTiui=1uTiuj=0∀1≤j<i.
iqiiS
Решение PCA также часто выражается через разложение по сингулярным числам . Чтобы понять , почему, пусть . Тогда и так (строго говоря, с точностью до знака сальто) и .XX=UDVTnS=XTX=VD2VTV=QΛ=D2/n
Главные компоненты находят, проецируя на векторы главных компонент. Из приведенной выше формулировки SVD легко увидеть, что
X
XQ=XV=UDVTV=UD.
Простота представления как главных компонентных векторов, так и самих основных компонентов в терминах SVD матрицы признаков является одной из причин, по которым SVD проявляется так заметно в некоторых вариантах лечения PCA.