История вопроса: я спросил у сотен участников моего опроса, насколько они заинтересованы в выбранных областях (по пятибалльной шкале Лайкерта, где 1 обозначает «неинтересно», а 5 - «заинтересовано»).
Затем я попробовал PCA. Картинка ниже представляет собой проекцию первых двух основных компонентов. Цвета используются для полов, а стрелки PCA являются исходными переменными (то есть интересами).
Я заметил, что:
- Точки (респонденты) довольно хорошо разделены вторым компонентом.
- Стрелок не осталось.
- Некоторые стрелки намного короче других.
- Переменные, как правило, составляют кластеры, но не наблюдения.
- Похоже, что стрелки, указывающие вниз (для мужчин), являются в основном интересами мужчин, а стрелки, направленные вверх, являются в основном интересами женщин.
- Некоторые стрелки указывают ни вниз, ни вверх.
Вопросы: Как правильно интерпретировать отношения между точками (респондентами), цветами (полами) и стрелками (переменными)? Какие еще выводы о респондентах и их интересах можно извлечь из этого сюжета?
Данные можно найти здесь .