PCA выбирает влиятельные измерения путем собственного анализа N точек данных, в то время как MDS выбирает влиятельные измерения путем анализа точек данных матрицы парных расстояний. Это имеет эффект выделения отклонений от однородности в распределении. Считая матрицу расстояний аналогом тензора напряжений, MDS можно считать алгоритмом «силового направления», сложность выполнения которого составляет O ( d N a ), где 3 < a ≤ 4 . N2O(dNa)3<a≤4
O(dN2)O(dN⋅log(N))2≤d≤4типичные наблюдаемые времена выполнения, как правило, длиннее, чем другие методы уменьшения размеров. Результаты часто более визуально интерпретируются, чем наивный собственный анализ, и в зависимости от распределения часто более интуитивны, чем результаты MDS, которые, как правило, сохраняют глобальную структуру за счет локальной структуры, сохраняемой t-SNE.
MDS уже является упрощением ядра PCA и должно быть расширяемым с помощью альтернативных ядер, а ядро t-SNE описано в работе Gilbrecht, Hammer, Schulz, Mokbel, Lueks et al. Я практически не знаком с этим, но, возможно, другой респондент может быть.
Я склонен выбирать между MDS и t-SNE исходя из контекстуальных целей. Что бы ни разъясняло структуру, которую я заинтересован в выделении, какая структура обладает большей объяснительной силой, то есть алгоритм, который я использую. Это можно считать ловушкой, так как это форма степени свободы исследователя. Но свобода, используемая с умом, не так уж плоха.