Инструмент командной строки для поиска файлов DOCX


9

Существует ли инструмент командной строки для текстового поиска файла docx? Я пытался grep, но он не работает с DOCX, хотя он прекрасно работает с файлами TXT и XML. Я мог бы сначала конвертировать docx в txt, но я бы предпочел инструмент, который работает непосредственно с файлами docx. Мне нужен инструмент для работы под Cygwin.

OP edit: Позже я узнал, что самый простой способ получить grep - это на самом деле преобразовать эти docx в txt, а затем grep поверх них.


Связанный ответ stackoverflow .
jw013

Я избавился от части DOS, так как это здесь не по теме
Майкл Мрозек

Ответы:


3

Я знаю несколько инструментов индексирования, которые поддерживают документы Word. Такие инструменты позволяют индексировать документы, а затем эффективно искать слова в индексе. Они не разрешают полнотекстовый поиск.


1

DOCx сжат, и это не текстовый формат. Так что вам нужен конвертер в первую очередь. После этого вы можете использовать findкоманду для преобразованных файлов.


Или вы можете использовать инструмент поиска, который может читать внутри сжатых файлов. В вашем последнем предложении, я полагаю, вы имели в виду grep?
Жиль "ТАК - перестань быть злым"

@ Жиль - посмотрите на оригинальное название вопроса, прежде чем Майкл его отредактировал. Похоже, это был вопрос о DOS (и я отметил его не по теме).
Нильс

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.