Мне кажется, что основная функция PCP состоит в том, чтобы выделять однородные группы людей или, наоборот, (в двойственном пространстве, по аналогии с PCA) специфические модели ассоциации по различным переменным. Он создает эффективную графическую сводку многомерного набора данных, когда не слишком много переменных. Переменные автоматически масштабируются до фиксированного диапазона (обычно 0–1), что эквивалентно работе со стандартизированными переменными (чтобы предотвратить влияние одной переменной на другие из-за проблемы масштабирования), но для очень многомерного набора данных (# переменных> 10), вы определенно должны смотреть на другие дисплеи, такие как график флуктуаций или тепловая карта, которые используются в исследованиях микрочипов.
Это помогает отвечать на такие вопросы, как:
- Существует ли какая-либо последовательная схема индивидуальных баллов, которая может быть объяснена определенным членством в классе (например, гендерная разница)?
- Икс1Икс2
На следующем графике данных радужной оболочки ясно видно, что виды (здесь показаны разными цветами) демонстрируют очень различающиеся профили при рассмотрении длины и ширины лепестка или что Iris setosa (синий) являются более однородными по длине лепестка ( т.е. их дисперсия ниже), например.
Вы даже можете использовать его в качестве основы для методов классификации или уменьшения размеров, таких как PCA. Чаще всего, при выполнении PCA, помимо уменьшения пространства функций, вы также хотите выделить группы людей (например, есть люди, которые систематически получают более высокие оценки по некоторой комбинации переменных); обычно это происходит путем применения некоторой иерархической кластеризации к показателям факторов и выделения итогового членства кластера в пространстве факторов (см. пакет FactoClass R.)
Он также используется в кластерных диаграммах ( Визуализация неиерархического и иерархического кластерного анализа ), целью которого является изучение эволюции распределения кластеров при увеличении количества кластеров (см. Также, Какие критерии остановки для агломерационной иерархической кластеризации используются на практике? ).
Такие отображения также полезны, когда они связаны с обычными точечными диаграммами (которые по конструкции ограничены 2D-отношениями), это называется чисткой и доступно в системе визуализации данных GGobi или в программном обеспечении Mondrian .