Учитывая огромную базу данных разрешенных слов (отсортированных по алфавиту) и слово, найдите слово из базы данных, которая является ближайшей к данному слову с точки зрения расстояния Левенштейна.
Наивный подход, конечно, состоит в том, чтобы просто вычислить левенштейновское расстояние между данным словом и всеми словами в словаре (мы можем выполнить бинарный поиск в базе данных, прежде чем вычислять расстояния).
Интересно, есть ли более эффективное решение этой проблемы? Может быть, какая-то эвристика, которая позволяет нам сократить количество слов для поиска или оптимизации алгоритма расстояния Левенштейна.
Ссылки на статьи по теме приветствуются.