Другим вариантом является ScanTailor . Эта программа особенно хорошо подходит для обработки нескольких сканов одновременно.
apt-get install scantailor
К сожалению, он работает только при вводе файлов изображений, но достаточно просто конвертировать отсканированный PDF в jpg. Вот одна строка, которую я использовал для преобразования целого каталога PDF-файлов в jpgs. Если PDF имеет n страниц, он создает n jpg файлов.
for f in ./*.pdf; do gs -q -dSAFER -dBATCH -dNOPAUSE -r300 -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -sDEVICE=png16m "-sOutputFile=$f%02d.png" "$f" -c quit; done;
У меня были скриншоты, готовые поделиться, но у меня недостаточно представителей, чтобы опубликовать их.
ScanTailor выводит в tif, поэтому, если вы хотите, чтобы файлы вернулись в PDF, вы можете использовать это, чтобы сделать PDF для каждой страницы.
for f in ./*.tif; do tiff2pdf "$f" -o "$f".pdf -p letter -F; done;
Затем вы можете использовать этот однострочник или приложение, такое как PDFShuffler, чтобы объединить любой или все файлы в один PDF.
gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=output.pdf *.pdf