Позволять быть функцией, которую мы называем функцией подобия . Примерами функции подобия являются косинусное расстояние, норма, расстояние Хэмминга, сходство Жакара и т. д.
Рассматривать двоичные векторы длины : ,
Наша цель - сгруппировать векторы, которые похожи. Более формально, мы хотим вычислить граф подобия, где узлы - это векторы, а ребра - векторы, которые похожи ().
а также очень большие числа, и сравнивая две длины векторы дорогие, мы не можем сделать всю грубую силу операции. Мы хотим вычислить граф подобия с существенно меньшим количеством операций.
Это возможно? Если нет, мы можем вычислить приближение к графу, которое содержит все ребра в графе подобия плюс, возможно, самое большее другие края?