Как искать в PDF, используя регулярные выражения?


15

Обычно я использую Notepad ++ для поиска в файлах с помощью регулярных выражений. Сегодня мне интересно, есть ли программа PDF, которая делает то же самое для PDF-файлов. Конечно, я мог бы конвертировать PDF в текст и использовать Notepad ++, но есть ли более простой способ без конвертации?


1
Какую ОС вы используете?
Скотт МакКленнинг

Windows Developer Preview и Windows 7
Майкл С.

Ответы:


9

несколько вариантов:


1
@akira А как насчет Linux?
Нихил

4
  1. Агент Ransack является бесплатным (облегченным) и поддерживает PDF, как подтверждают его заметки о выпуске.
  2. PowerGREP является коммерческим продуктом.

Как вы сказали, очевидной альтернативой является преобразование PDF в текст. Один из способов для программиста настроить его для массовой обработки - использовать пакет Python PDFMiner. Агент Ransack использует «pdftotext» из проекта Xpdf (и вы тоже можете).


Sidenote: Агент Ransack облегченная версия FileLocator
Акира

Благодарность! Я посмотрел повнимательнее. Замечания к выпуску производителя подтверждают, что File Locator Lite, также известный как Agent Ransack, поддерживает PDF. Редактирование моего ответа.
минопрет

Агент Рансак делает работу. Вы также можете попробовать DnGrep.
Майкл С.
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.