Нагрузки (которые не следует путать с собственными векторами) имеют следующие свойства:
- Их суммы квадратов внутри каждого компонента являются собственными значениями (дисперсиями компонентов).
- Нагрузки - это коэффициенты в линейной комбинации, предсказывающие переменную (стандартизированными) компонентами.
Вы извлекли 2 первых ПК из 4. Матрица нагрузок и собственные значения:A
A (loadings)
PC1 PC2
X1 .5000000000 .5000000000
X2 .5000000000 .5000000000
X3 .5000000000 -.5000000000
X4 .5000000000 -.5000000000
Eigenvalues:
1.0000000000 1.0000000000
В этом случае оба собственных значения равны. Это редкий случай в реальном мире, он говорит, что PC1 и PC2 имеют одинаковую объяснительную «силу».
Предположим, что вы также вычислили значения компонентов, Nx2
матрицу и вы z-стандартизировали (среднее = 0, st. Dev. = 1) их в каждом столбце. Тогда (как пункт 2 выше говорит), Х = С ' . Но, так как вы оставили только 2 ПК из 4 (вам не хватает еще 2 столбцов в A ) значения Восстановленные данные X не точны, - есть ошибка (если собственные значения 3, 4 не равны нулю).CX^=CA′AX^
A4x4
B=(A−1)′B=A⋅diag(eigenvalues)−1=(A+)′diag(eigenvalues)
квадратная диагональная матрица с собственными значениями на ее диагонали, а +
верхний индекс обозначает псевдообратную. В твоем случае:
diag(eigenvalues):
1 0
0 1
B (coefficients to predict components by original variables):
PC1 PC2
X1 .5000000000 .5000000000
X2 .5000000000 .5000000000
X3 .5000000000 -.5000000000
X4 .5000000000 -.5000000000
XNx4
C=XBC
ПК1 = 0,5 * Х1 + 0,5 * Х2 + 0,5 * Х3 + 0,5 * Х4 ~ (Х1 + Х2 + Х3 + Х4) / 4
«Первый компонент пропорционален среднему баллу»
ПК2 = 0,5 * Х1 + 0,5 * Х2 - 0,5 * Х3 - 0,5 * Х4 = (0,5 * Х1 + 0,5 * Х2) - (0,5 * Х3 + 0,5 * Х4)
«второй компонент измеряет разницу между первой парой баллов и второй парой баллов»
B=A
B=A⋅diag(eigenvalues)−1B=R−1ARбыть ковариационной (или корреляционной) матрицей переменных. Последняя формула исходит непосредственно из теории линейной регрессии. Две формулы эквивалентны только в контексте PCA. В факторном анализе это не так, и для вычисления факторных баллов (которые всегда являются приблизительными в FA) следует полагаться на вторую формулу.
Связанные ответы моих:
Подробнее о нагрузках против собственных векторов .
Как вычисляются оценки основных компонентов и факторов .