Основная идея к-ближайших соседей учитывает ближайших точек и определяет классификацию данных большинством голосов. Если это так, то он не должен иметь проблемы в более высоких размерности данных , поскольку такие методы , как н.п. чувствительное хеширование могут эффективно находить ближайшие сосед.
Кроме того, выбор функции с сетями байесовскими может уменьшить размерность данных и сделать обучение более легким.
Тем не менее, этот обзорный документ Джона Лафферти в области статистического обучения указывает на то, что непараметрическое обучение в многомерных пространствах признаков все еще остается проблемой и не решено.
Что не так?