Можно использовать библиотеку pdf2image.
Вы можете установить его, просто используя,
pip install pdf2image
После установки вы можете использовать следующий код для получения изображений.
from pdf2image import convert_from_path
pages = convert_from_path('pdf_file', 500)
Сохранение страниц в формате jpeg
for page in pages:
page.save('out.jpg', 'JPEG')
Изменить: в репозитории Github pdf2image также упоминается, что он использует pdftoppm
и требует других установок:
pdftoppm - это программа, которая творит чудеса. Он распространяется как часть большого пакета под названием poppler . Пользователи Windows должны будут установить poppler для Windows . Пользователи Mac должны будут установить poppler для Mac . У пользователей Linux будет предустановлен pdftoppm с дистрибутивом (протестировано на Ubuntu и Archlinux), если это не так, запустите sudo apt install poppler-utils
.
Вы можете установить последнюю версию под Windows с помощью anaconda, выполнив следующие действия:
conda install -c conda-forge poppler
Примечание: версии Windows до 0,67 доступны по адресу http://blog.alivate.com.au/poppler-windows/, но обратите внимание, что версия 0,68 была выпущена в августе 2018 года, поэтому вы не получите новейшие функции или исправления ошибок.