В 1999 году Beyer et al. спросил, когда смысл "Ближайший сосед"?
Существуют ли лучшие способы анализа и визуализации влияния плоскостности расстояний на поиск NN с 1999 года?
Предоставляет ли [данный] набор данных значимые ответы на проблему 1-NN? Проблема 10-НН? Проблема 100-НН?
Как бы вы, эксперты, подошли к этому вопросу сегодня?
Изменения: понедельник, 24 января:
Как насчет «расстояния белого» как более короткого названия для «плоскостности расстояния с увеличивающимся измерением»?
Простой способ взглянуть на «дистанционное исчезновение» - это запустить 2-NN и построить расстояния до ближайшего соседа и второго ближайшего соседа. График ниже показывает dist 1 и dist 2 для диапазона кластеров и размеров по Монте-Карло. Этот пример показывает довольно хороший контраст расстояния для масштабированной абсолютной разности | dist 2 - dist 1 |. (Относительные различия | dist 2 / dist 1 | → 1 при измерении → ∞, поэтому становятся бесполезными.)
То, следует ли использовать абсолютные или относительные ошибки в данном контексте, зависит, конечно, от «реального» присутствующего шума: трудно.
Предложение: всегда бегать 2-нн; 2 соседа полезны, когда они рядом, и полезны, когда нет.