В Википедии есть несколько ресурсов, но вам действительно повезет, если у вас есть домен, который представляет собой простое ванильное английское слово, достаточно распространенное, чтобы появляться здесь.
Вы можете использовать инструмент генерации опечаток ключевых слов или что-то в этом роде, а затем кропотливо вводить каждый из них в Google - который по иронии судьбы попытается исправить ваше правописание - затем использовать «поиск вместо {неправильно написанная версия}» и посмотреть, сколько поиска результаты, которые вы получаете за это конкретное опечатка:
Отображение результатов для трактата
Вместо этого ищите tretise
Это дает около 117 000 результатов для «tretise» против 17 800 000 результатов для «трактата». Итак, теперь у вас есть представление о том, как часто это опечатка встречается во всем Интернете! Таким образом, вы можете отдавать предпочтение опечаткам, которые встречаются чаще в реальном мире.
Возможно, самое главное, я также нашел эти страницы:
http://how-to-spell.net/treatise
Как пишется трактат?
Правильно: трактат .
Распространенные орфографические ошибки: tretise - 100%
Который, видимо , использует реальные данные!
Мы собрали процент ошибок в почти 15 423 252 проверках правописания на веб-сайте spellchecker.net (январь 2010 г. - июнь 2012 г.).
В идеале мне бы понравилось, если бы Google поделился данными об орфографических ошибках, так как я подозреваю, что у них гораздо больше данных ... но я не уверен, что они готовы поделиться, может быть, они рассматривают автоматическую коррекцию орфографии неправильно набранных поисковых терминов как конкурентное преимущество.
Было бы здорово, если бы они сделали!