Вот объяснение прямо из источника (почти)
в мин 22:03
Стоит смотреть!
В основном и в соответствии с бывшим техническим директором Google Дугласом Мерриллом это выглядит так:
1) Вы пишете (с ошибкой) слово в Google
2) Вы не нашли то, что хотели (не нажимайте на результаты)
3) Вы понимаете, что неправильно написали слово, поэтому вы переписываете слово в поле поиска.
4) Вы найдете то, что хотите (нажимаете на первые ссылки)
Этот шаблон, умноженный в миллионы раз, показывает, какие ошибки наиболее распространены и каковы наиболее «общие» исправления.
Таким образом, Google может почти мгновенно предлагать исправление заклинаний на любом языке.
Кроме того, это означает, что если в одночасье все начнут произносить ночь, так как «nigth» Google предложит это слово.
РЕДАКТИРОВАТЬ
@ThomasRutter: Дуглас описывает это как «статистическое машинное обучение».
Они знают, кто исправляет запрос, потому что они знают, какой запрос исходит от какого пользователя (используя куки)
Если пользователи выполняют запрос, и только 10% пользователей нажимают на результат, а 90% возвращаются и вводят другой запрос (с исправленным словом), и на этот раз 90% нажимают на результат, тогда они знают, что нашли исправление.
Они также могут знать, являются ли они «связанными» запросами двух разных, потому что у них есть информация обо всех ссылках, которые они показывают.
Кроме того, теперь они включают контекст в проверку орфографии, поэтому они могут даже предложить другое слово в зависимости от контекста.
Посмотрите эту демонстрацию волны Google (@ 44m 06s), которая показывает, как контекст учитывается для автоматического исправления орфографии.
Здесь объясняется, как работает обработка на естественном языке.
И, наконец, вот потрясающая демонстрация того, что можно сделать, добавив в микс автоматический машинный перевод (@ 1 ч 12 м 47 с).
Я добавил привязки минут и секунд к видео, чтобы перейти непосредственно к контенту, если они не работают, попробуйте перезагрузить страницу или прокрутить вручную до метки.