Кластеризация с асимметричными измерениями расстояния


9

Как кластеризовать объект с асимметричной мерой расстояния?

Например, предположим, что вы кластеризуете набор данных с днями недели как функцией - расстояние от понедельника до пятницы не совпадает с расстоянием от пятницы до понедельника.

Как вы включаете это в меру расстояния алгоритма кластеризации?

Ответы:


3

Если расстояние СЧ является асимметричным, потому что будущее отличается от прошлого, тогда требуется подлинная асимметричная кластеризация. Во-первых, должна быть определена асимметричная функция расстояния.

Одним из способов асимметричной кластеризации с учетом функции расстояния является внедрение исходных данных в новое координатное пространство. См. «Геометрические структуры некоторых моделей на расстоянии для асимметричных МДС», автор Наохито Чино и Кеничи Ширайва, Behaviormetrika, 1992 ( pdf ). Это называется HCM (эрмитова каноническая модель).

ЧАС

ЧАСяJзнак равно12[d(Икся,ИксJ)+d(ИксJ,Икся)]+я12[d(Икся,ИксJ)-d(ИксJ,Икся)]

Это преобразует данные в пространство комплексных чисел. После того, как данные внедрены, расстояние между объектами x и y равно x * y, где * - сопряженная транспонирование. В этот момент вы можете запустить k-средних на комплексных векторов.

Спектрально-асимметричная кластеризация также была выполнена, см. Тезис Стефана Эмилова Атева «Использование асимметрии в спектральной кластеризации траекторий», Университет Миннесоты, 2011 г., который дает код MATLAB для специального алгоритма.


1

Вы можете взять какое-то среднее значение (например, среднее арифметическое или, для вероятностных распределений, квадратный корень из расхождения Дженсена – Шеннона).


1

Вы должны взглянуть на круговую статистику (если вы хотите работать "в течение" недели обучения)


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.