Словарь текстового файла [закрыто]


222

Я пишу программу, которая требует много слов английского языка. Я пытаюсь найти файл словаря, в котором много слов. Кто-нибудь знает хороший источник? Я перепробовал много источников, но, похоже, их нет.


3
@ Право Я не удалил его, я закрыл его, потому что он не соответствует текущим ожиданиям переполнения стека. Он явно просит рекомендации, ссылки на которые не по теме.
Тарын

Правда, я забыл, что On Hold переходит в Closed, а не удаляется.
DWright

Итак, @bluefeet, извините за мой «протестующий» комментарий, который был дезинформирован, ваше действие правильное и не вычитает ценность.
DWright

15
Зачем извиняться? Очевидно, что это имеет значение для SO сообщества. «Текущие ожидания» SO явно не соответствуют действительности.
Андрей

Ответы:


224

Как насчет /usr/share/dict/wordsлюбой системы Unix? Сколько слов мы говорим? Как OED-Unabridged?


20
Спасибо ! 200000+ слов, высоко ценится! cat /usr/share/dict/words > words.txtвсе вещи !
Jokoon

7
Если вам не хватает этого файла, вы можете установить его в Debian / Ubuntu, набравsudo apt-get install wbritish
airstrike

17
Кто-нибудь случайно знает место, где его можно скачать для не-Unix систем?
Том

2
@ Tom Да, www.FreeBSD.org (установите FreeBSD где-нибудь и бум, у вас есть). В остальном я думаю, что этот список похож: raw.githubusercontent.com/eneko/data-repository/master/data/… .
Грег Шмит

2
В случае , если вы не знаете: Это будет работать на MacOS тоже :)
Льюис

44

Для файла .txt английского словаря вы можете использовать пользовательский словарь .

Вы также можете создать список aspell или wordlist с собственными настройками.

Также вы можете взглянуть на http://wordlist.sourceforge.net/

Только английские слова: http://www.math.sjsu.edu/~foster/dictionary.txt


Хотя эта ссылка может ответить на вопрос, лучше включить сюда основные части ответа и предоставить ссылку для справки. Ответы, содержащие только ссылки, могут стать недействительными, если связанная страница изменится.
DeanOC

21
@DeanOC: Я думаю, что довольно просто, что «существенными частями» словаря будет весь словарь. Это не практично вставлять здесь. Также довольно ясно, что использование: выхватить слова из этого. Так что на самом деле это не только ссылка. Это законный рекомендационный ответ на вопрос, который должен быть (и сейчас) закрыт.
Натан Тагги

@NathanTuggy Этот ответ появился в очереди LQP, и я считаю, что он соответствует определению ответа только по ссылке. Как пользователь с репутацией <3K, мой голос за удаление ничего не делает, кроме как помогает привлечь к нему внимание того, кто может.
DeanOC

1
@DeanOC: я знаю, что это появилось в LQP. Я нажимаю «выглядит хорошо» по указанным причинам: в основном, «только ссылка» гораздо более тонко, чем «имеет ссылку, но нет кода или цитаты? BURN WITH FIRE». Следует отметить , что достаточно Рекомендуют выбор удаления, даже 2k пользователи будут удалять сообщения. (Лично я отвечал за то, что опрокинул ряд постов.)
Натан Тагги,

@NathanTuggy Вы можете свободно голосовать по своему усмотрению. Я проголосовал за удаление, так как не вижу значения в этом ответе, если ссылка устарела.
DeanOC


35

http://www.math.sjsu.edu/~foster/dictionary.txt

350 000 слов

Очень поздно, но может быть полезно для других.


24
Глядя на первые несколько, многие не являются обычными английскими словами.
tripleee

8
это было бесполезно, так как в нем отсутствовали многие простые слова, такие как грех, в ...
FernandoZ

7
Да, и есть такие слова, как "wwwwwww". Ни слова.
Джаред Форсайт

1
Осторожно, эта ссылка приводит к сбою моего Firefox, потому что он пытается загрузить весь файл ahahahaha
Эндрю

@ Эндрю не падает в Chrome 50.
Богдан М.

11

Там также WordNet . Его формат файлов данных хорошо документирован.
Я использовал его для создания встраиваемой библиотеки словарей для разработчиков iOS ( www.lexicontext.com ), а также в одном из моих приложений.


2
Джекпот. Если кто-то ищет слова, сопоставленные с их частями речи, просто загрузите основной пакет WordNet.
Андрей

10

@ Future-Searchers: вы можете использовать aspell для проверки словаря, он имеет привязки в ruby ​​и python. Это сделало бы вашу работу намного проще.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.