Как упоминалось в предыдущем ответе, существует ряд методов уменьшения размерности, и важно учитывать, что вы пытаетесь представить - вас интересуют евклидовы меры расстояния? Или показатель сходства между образцами?
Для первых, PCA может быть уместным. Обычно используется с непрерывными измерениями, такими как измерения образцов (животных, растений и т. Д.). Я хотел бы взглянуть на более современные упоминания в более раннем ответе, хотя.
В последнем случае, когда вы можете пытаться сравнить сходство, используя неевклидову метрику расстояния, существует несколько хороших методов, таких как расположение основных компонентов (PCoA) и неметрическое многомерное масштабирование (NMDS). Пример того, когда вы могли бы использовать их, - это когда вы сравниваете экологические сообщества между различными областями, и у вас есть количество различных типов организмов, которые были найдены. Итак, ваши данные - это «подсчитать» данные. Существует ряд метрик сходства, таких как Жаккар, Соренсен, Брей-Кертис, которые позволяют эффективно оценить, насколько сходны сайты по своему составу организмов. PCoA и NMDS в основном позволяют построить образцы (участки) для представления экологического расстояния (сходства), и у вас есть оценка для участка на каждой оси.
Есть много хороших книг и других ресурсов для многомерного анализа. Ищите "Посвящение" в Google. Кроме того, есть пакет R под названием «веганский», который действительно хорош для выполнения большей части этой работы.