Интерпретация баллов PCA


16

Может ли кто-нибудь помочь мне в интерпретации результатов PCA? Мои данные взяты из анкеты об отношении к медведям. Согласно нагрузкам, я интерпретировал один из моих основных компонентов как «страх медведей». Будут ли оценки этого основного компонента связаны с тем, как каждый респондент оценивает этот основной компонент (оценивает ли он / она положительно / отрицательно)?


Краткий ответ на ваш вопрос - ДА.
говорит амеба: восстанови Монику

Ответы:


13

В основном, факторные оценки рассчитываются как необработанные ответы, взвешенные по факторным нагрузкам. Итак, вам нужно посмотреть на факторные нагрузки вашего первого измерения, чтобы увидеть, как каждая переменная связана с основным компонентом. Наблюдение высоких положительных (соответственно отрицательных) нагрузок, связанных с конкретными переменными, означает, что эти переменные вносят положительный (соответственно отрицательный) вклад в этот компонент; следовательно, люди, получающие высокие баллы по этим переменным, будут склонны иметь более высокие (или соответственно более низкие) показатели факторов в этом конкретном измерении.

Рисование круга корреляции полезно, чтобы иметь общее представление о переменных, которые вносят вклад «положительно» против «отрицательно» (если есть) в первую главную ось, но если вы используете R, вы можете взглянуть на пакет FactoMineR иdimdesc() функция.

Вот пример с USArrestsданными:

> data(USArrests)
> library(FactoMineR)
> res <- PCA(USArrests)
> dimdesc(res, axes=1)  # show correlation of variables with 1st axis
$Dim.1
$Dim.1$quanti
         correlation  p.value
Assault        0.918 5.76e-21
Rape           0.856 2.40e-15
Murder         0.844 1.39e-14
UrbanPop       0.438 1.46e-03
> res$var$coord  # show loadings associated to each axis
         Dim.1  Dim.2  Dim.3   Dim.4
Murder   0.844 -0.416  0.204  0.2704
Assault  0.918 -0.187  0.160 -0.3096
UrbanPop 0.438  0.868  0.226  0.0558
Rape     0.856  0.166 -0.488  0.0371

Как видно из последнего результата, первое измерение в основном отражает насильственные действия (любого рода). Если мы посмотрим на отдельную карту, то станет ясно, что государства, расположенные справа, являются теми, где такие действия наиболее часты.

альтернативный текст альтернативный текст

Вы также можете быть заинтересованы в этом связанном вопросе: Каковы основные оценки компонента?


5

Для меня оценки PCA - это просто перестановка данных в форме, которая позволяет мне объяснить набор данных с меньшим количеством переменных. Баллы показывают, насколько каждый элемент относится к компоненту. Вы можете назвать их в соответствии с факторным анализом, но важно помнить, что они не являются скрытыми переменными, поскольку PCA анализирует все отклонения в наборе данных, а не только общие элементы (как это делает факторный анализ).


Да, вы правы, говоря, что в PCA нет модели ошибок, в отличие от FA. У меня +1 к этой конкретной точке. Обратите внимание, что я сказал «имеет смысл учитывать», а не то, что главные компоненты, извлеченные из PCA, являются истинными LV. Если вы не заинтересованы в оценке надежности шкалы или в моделях измерения, то не имеет значения, используете ли вы PCA или FA, однако. Теперь анализ данных часто связан с объяснением корреляции между переменными или поиском групп субъектов, отсюда и идея интерпретации одного или нескольких измерений факторного пространства. (...)
chl

(...) FactoMineR включает в себя набор данных о винах, и для его воспроизведения можно использовать многие факторные методы (PCA, MFA) и даже PLS или CCA, как это сделал Мишель Тененхаус.
chl

@ chl, спасибо за подсказку относительно пакета, я проверю это. На PCA против FA я согласен до определенного момента. Я предпочитаю ФА для большинства применений, так как я финансирую оценки сообществ (общая дисперсия), чтобы быть очень полезными при оценке ценности конкретной структуры фактора. Это может быть просто личное предпочтение, однако.
richiemorrisroe

Вы совершенно правы (я уже проголосовал за ваш предыдущий ответ, потому что он был очень ясным). Просто (без изменений) PCA имеет собственную историю анализа данных (особенно во французской школе) вместе с CA, MFA, MCA. С другой стороны, у Пола Клайна есть две очень хорошие книги об использовании ФА в исследованиях личности. И грядущая книга Уильяма Ревелла должна понравиться пользователям R :). В любом случае, я думаю, мы согласны, что это полезные инструменты для анализа структуры корреляционной матрицы.
chl

0

Результаты PCA (различные измерения или компоненты), как правило, не могут быть переведены в реальную концепцию. Я считаю неправильным предполагать, что одним из компонентов является «страх перед медведями», что привело вас к мысли, что именно этот компонент имел в виду? Процедура главных компонентов преобразует вашу матрицу данных в новую матрицу данных с тем же или меньшим количеством измерений, и результирующие измерения варьируются от того, который лучше объясняет разницу, до того, который объясняет это меньше. Эти компоненты рассчитываются на основе комбинации исходных переменных с вычисленными собственными векторами. Общая процедура PCA конвертирует исходные переменные в ортогональные (линейно независимые). Надеюсь, что это поможет вам прояснить немного о процедуре PCA


Согласитесь ли вы с тем, что линейная комбинация некоторых переменных все еще может интерпретироваться как отражающая некоторый взвешенный вклад каждой из них в ось фактора?
ЧЛ

Да, это именно так.
Мариана Соферфер

Итак, почему мешает дать ему имя? Переменные просто рассматриваются как явные переменные, и в некоторых случаях имеет смысл рассматривать их взвешенную комбинацию как отражающую скрытый (ненаблюдаемый) фактор.
chl
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.