Интерпретация болтов в анализе главных компонентов


30

Я наткнулся на этот хороший учебник: Руководство по статистическому анализу с использованием R. Глава 13. Анализ основных компонентов: Олимпийский гепатлон о том, как делать PCA на языке R. Я не понимаю интерпретацию рисунка 13.3:

biplot

Итак, я строю первый собственный вектор против второго собственного вектора. Что это значит? Предположим, что собственное значение, соответствующее первому собственному вектору, объясняет 60% вариации в наборе данных, а второе собственное значение-собственный вектор объясняет 20% вариации. Что значит изображать их друг против друга?


Ответы:


22

ppXn×p

Xuupпеременные или их комбинация. В вашем случае, рис. 13.3 в HSAUR показывает, что Джойнер-Керзее (Jy-K) имеет высокий (отрицательный) балл по 1-й оси, что говорит о том, что он показал хорошие результаты на всех соревнованиях. Та же самая линия рассуждения применяется для интерпретации второй оси. Я очень кратко смотрю на рисунок, поэтому не буду вдаваться в подробности, и моя интерпретация, безусловно, поверхностна. Я предполагаю, что вы найдете дополнительную информацию в учебнике HSAUR. Здесь стоит отметить, что как переменные, так и отдельные лица показаны на одной диаграмме (это называется биплотомr(x1,x2)=cos2(x1,x2)

Тем не менее, я думаю, что вам лучше начать читать вводную книгу по многомерному анализу, чтобы глубже понять методы, основанные на PCA. Например, Б. Everitt написал прекрасный учебник по этой теме, R и S-Plus ® Companion в многомерный анализ , и вы можете проверить сайт компаньона для иллюстрации. Существуют и другие замечательные R-пакеты для прикладного многомерного анализа данных, такие как ade4 и FactoMineR .


r(x1,x2)=cos(x1,x2)cos2(x1,x2)

21

Сюжет показывает:

  • оценка каждого случая (т. е. спортсмена) по первым двум основным компонентам
  • загрузка каждой переменной (т. е. каждого спортивного события) по первым двум основным компонентам.

Левая и нижняя оси показывают [нормализованные] оценки основных компонентов; верхняя и правая оси показывают нагрузки.

В общем, предполагается, что два компонента объясняют достаточное количество дисперсии, чтобы обеспечить содержательное визуальное представление структуры случаев и переменных.

Вы можете посмотреть, какие события находятся близко друг к другу в пространстве. Если это применимо, это может указывать на то, что спортсмены, которые хороши в одном соревновании, вероятно, также будут хороши в других ближайших соревнованиях. В качестве альтернативы вы можете использовать сюжет, чтобы увидеть, какие события являются отдаленными. Например, метание копья кажется чем-то вроде выброса и основным событием, определяющим второй основной компонент. Возможно, другой тип спортсмена хорош в метании копья, чем в большинстве других соревнований.

Конечно, можно сказать больше о предметной интерпретации.



Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.