PCA - это, прежде всего, метод сокращения данных, целью которого является получение проекции данных в пространство меньшего размера. Две эквивалентные цели состоят в том, чтобы либо максимизировать дисперсию итеративно, либо минимизировать ошибку реконструкции. Это на самом деле проработано в некоторых деталях в ответах на этот предыдущий вопрос .
Напротив, факторный анализ - это прежде всего порождающая модель мерного вектора данных X, говорящая о том, что
X = A S + ϵ,
где S - q- мерный вектор скрытых факторов, A - это p × k с k < p, а ϵ - это вектор некоррелированных ошибок. Матрица является матрицей факторных нагрузок . Это дает специальную параметризацию ковариационной матрицы как
Σ = A A T + DпИкс
Икс= A S+ ϵ
SQAр × кк < рεAΣ = A AT+ D
Проблема этой модели заключается в том, что она является чрезмерно параметризованной. Такая же модель получается, если
заменить на
A R для любой
k × k ортогональной матрицы
R , что означает, что сами факторы не являются уникальными. Существуют различные предложения для решения этой проблемы, но
не существует единственного решения, которое дало бы вам факторы с той интерпретацией, о которой вы просите. Один популярный выбор - вращение
Varimax . Однако используемый критерий определяет только вращение. Пространство столбцов, охватываемое
A , не изменяется, и, поскольку оно является частью параметризации, оно определяется любым методом, используемым для оценки
ΣAA Rк × крAΣ - по максимальной вероятности в гауссовой модели, скажем.
Следовательно, чтобы ответить на вопрос, выбранные факторы не задаются автоматически при использовании модели факторного анализа, поэтому не существует единой интерпретации первых факторов. Необходимо указать метод, используемый для оценки (пространство столбцов) A, и метод, используемый для выбора поворота. Если D = σ 2 I (все ошибки имеют одинаковую дисперсию), решением MLE для пространства столбцов A является пространство, охватываемое ведущими q векторами главных компонент, которые могут быть найдены посредством разложения по сингулярным числам. Конечно, можно выбрать не вращать и сообщать об этих основных компонентных векторах как факторах. КAD = σ2яAQ
kkk