использование pdfimages
pdfimages инструмент для извлечения изображений в формате PDF, который сохраняет изображения в файле PDF в формат (ы) PPM, PBM, JPEG или JPEG 2000.
Это часть poppler-utilsпакета, которую вам нужно установить.
Использование: pdfimages [options] <PDF-file> <image-root>
Пример: следующее извлекает все изображения из файла PDF, сохраняя их в формате JPEG.
pdfimages -j in.pdf /tmp/out
Сохранит изображения из файла PDF in.pdfв файлы /tmp/out-000.jpg(или /tmp/out-000.pbm; см. Ниже) /tmp/out-001.jpgи т. Д.
Справочная страница pdfimages объясняет:
-j: Normally, all images are written as PBM (for monochrome images) or PPM for
non-monochrome images) files. With this option, images in DCT format are
saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.
pdfimagesли это сделать лучше / хуже, чем NitroPDF?