Интерпретация болтов в анализе главных компонентов

30

Я наткнулся на этот хороший учебник: Руководство по статистическому анализу с использованием R. Глава 13. Анализ основных компонентов: Олимпийский гепатлон о том, как делать PCA на языке R. Я не понимаю интерпретацию рисунка 13.3:

biplot

Итак, я строю первый собственный вектор против второго собственного вектора. Что это значит? Предположим, что собственное значение, соответствующее первому собственному вектору, объясняет 60% вариации в наборе данных, а второе собственное значение-собственный вектор объясняет 20% вариации. Что значит изображать их друг против друга?

— user862
источник

1

См. Также stats.stackexchange.com/q/73286/3277 , stats.stackexchange.com/q/147671/3277 , stats.stackexchange.com/q/137240/3277 .

— ttnphns

22

$p$ $p$ $X$ $n \times p$

$Xu$ $u$ $p$ переменные или их комбинация. В вашем случае, рис. 13.3 в HSAUR показывает, что Джойнер-Керзее (Jy-K) имеет высокий (отрицательный) балл по 1-й оси, что говорит о том, что он показал хорошие результаты на всех соревнованиях. Та же самая линия рассуждения применяется для интерпретации второй оси. Я очень кратко смотрю на рисунок, поэтому не буду вдаваться в подробности, и моя интерпретация, безусловно, поверхностна. Я предполагаю, что вы найдете дополнительную информацию в учебнике HSAUR. Здесь стоит отметить, что как переменные, так и отдельные лица показаны на одной диаграмме (это называется биплотом $r(x_1,x_2)=\cos^2(x_1,x_2)$

Тем не менее, я думаю, что вам лучше начать читать вводную книгу по многомерному анализу, чтобы глубже понять методы, основанные на PCA. Например, Б. Everitt написал прекрасный учебник по этой теме, R и S-Plus ^® Companion в многомерный анализ , и вы можете проверить сайт компаньона для иллюстрации. Существуют и другие замечательные R-пакеты для прикладного многомерного анализа данных, такие как ade4 и FactoMineR .

— хл
источник

r (x_{1}, x_{2}) = \cos (x_{1}, x_{2})

$r(x_1, x_2) = \cos(x_1, x_2)$

\cos^{2} (x_{1}, x_{2})

$\cos^2(x_1, x_2)$

21

Сюжет показывает:

оценка каждого случая (т. е. спортсмена) по первым двум основным компонентам
загрузка каждой переменной (т. е. каждого спортивного события) по первым двум основным компонентам.

Левая и нижняя оси показывают [нормализованные] оценки основных компонентов; верхняя и правая оси показывают нагрузки.

В общем, предполагается, что два компонента объясняют достаточное количество дисперсии, чтобы обеспечить содержательное визуальное представление структуры случаев и переменных.

Вы можете посмотреть, какие события находятся близко друг к другу в пространстве. Если это применимо, это может указывать на то, что спортсмены, которые хороши в одном соревновании, вероятно, также будут хороши в других ближайших соревнованиях. В качестве альтернативы вы можете использовать сюжет, чтобы увидеть, какие события являются отдаленными. Например, метание копья кажется чем-то вроде выброса и основным событием, определяющим второй основной компонент. Возможно, другой тип спортсмена хорош в метании копья, чем в большинстве других соревнований.

Конечно, можно сказать больше о предметной интерпретации.

— Джером англим
источник

2

Смотрите также: Какие четыре оси на биплоте PCA?

— говорит амеба: восстанови монику

2

См. Также: Расположение стрелок на биплоте PCA .

— говорит амеба: восстанови Монику