В Windows много программного обеспечения для объединения PDF-файлов, но как мы можем сделать то же самое в Ubuntu?
В Windows много программного обеспечения для объединения PDF-файлов, но как мы можем сделать то же самое в Ubuntu?
Ответы:
Если вам нужен инструмент с простым графическим интерфейсом, попробуйте pdfshuffler . Это позволяет объединять PDF-файлы, а также переупорядочивать и удалять страницы. Для пакетной обработки и / или более сложных задач pdftk, конечно, более мощный.
pdfshuffler
работает нормально на 14.04 amd64.
Объединить два файла PDF file1.pdf
и file2.pdf
:
pdftk file1.pdf file2.pdf cat output mergedfile.pdf
Более подробная информация доступна здесь Way Back Machine .
cat
и output
следуют переменным входным аргументам, а затем снова выходной аргумент.
Ghostscript - это пакет (доступный по умолчанию в Ubuntu), который позволяет просматривать или распечатывать файлы PostScript и PDF в другие форматы или преобразовывать эти файлы в другие форматы.
Чтобы использовать Ghostscript для объединения файлов PDF, введите что-то вроде следующего:
gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -dAutoRotatePages=/None -sOutputFile=finished.pdf file1.pdf file2.pdf
Вот краткое объяснение команды:
gs starts the Ghostscript program.
-dBATCH once Ghostscript processes the PDF files, it should exit.
If you don't include this option, Ghostscript will just keep running.
-dNOPAUSE forces Ghostscript to process each page without pausing for user interaction.
-q stops Ghostscript from displaying messages while it works
-sDEVICE=pdfwrite
tells Ghostscript to use its built-in PDF writer to process the files.
-sOutputFile=finished.pdf
tells Ghostscript to save the combined PDF file with the specified name.
-dAutoRotatePages=/None
Acrobat Distiller parameter AutoRotatePages controls the automatic orientation selection algorithm: For instance: -dAutoRotatePages=/None or /All or /PageByPage.
Ваши входные файлы даже не должны быть файлами PDF. Вы также можете использовать файлы PostScript или EPS или любую их комбинацию.
С Ghostscript вы можете многое сделать. Вы можете прочитать его документацию для более подробной информации.
pdftk
заняло 0m0.484s, gs
заняло 1m32.898s (это почти в 200 раз медленнее) gs
.
file1.pdf file2.pdf
наfile*.pdf
gs
работал с некоторыми "неконформными" PDF-файлами, где pdftk
бы просто работал вечно.
file*.pdf
с file1.pdf file2.pdf
перед передачей аргументы команды.
Вы также используете pdfunite для объединения PDF-документов:
pdfunite in-1.pdf in-2.pdf in-n.pdf out.pdf
out.pdf
будет перезаписан без предупреждения, поэтому pdfunite *.pdf
он не будет работать должным образом.
cp
также перезаписывает последний аргумент без предупреждения. Это только для спешащих пользователей (как и я) - мне повезло, у меня была резервная копия файла, о котором идет речь ...
Очень хорошее решение - PDFChain. Это графический интерфейс PDFTK, где вы можете объединять, разделять или даже добавлять фон в ваши PDF-файлы.
apt
также не дала никаких результатов: /
Альтернативный подход заключается в использовании латекса, как описано в этом посте ( без корневого доступа при условии, что у вас установлен pdflatex ): https://tex.stackexchange.com/questions/8662/merge-two-pdf-files-output-by- латекс
Это полезно, если у вас нет упомянутых инструментов или привилегий root, но у вас есть pdflatex.
Я копирую код tex ниже, чтобы объединить file1.pdf
и file2.pdf
. Создайте файл с именем output.tex
и поместите:
\documentclass{article}
\usepackage{pdfpages}
\begin{document}
\includepdf[pages=-]{file1}
\includepdf[pages=-]{file2}
\end{document}
А для компиляции просто используйте: pdflatex output.tex
Объединенный файл будет назван как output.pdf
.
Я использую pdfseparate для извлечения определенных страниц из большого файла PDF:
pdfseparate -f 156 -l 157 input.pdf output_%d.pdf
pdfseparate -f 1 -l 2 input.pdf output_%d.pdf
и после этого я присоединяюсь ко всем по команде:
pdfunite $(ls -v output_*.pdf | tr '\n' ' ') out$(date +%Y-%m-%d_%H_%M_%S ).pdf
Это присоединяется:
output_1.pdf output_2.pdf output_156.pdf output_157.pdf
в:
out2014-12-14_23_25_36.pdf
Может быть, есть более простой способ справиться ... :-)
pdfunite output_*.pdf out$(date +%Y-%m-%d-%H_%M_%S).pdf
но в ней отсутствует порядок ls -v
. Очевидным и тривиальным решением является присвоение имен файлам таким образом, чтобы они естественным образом сортировались в том порядке, в котором вы хотите их включить. Если вы абсолютно хотите ls -v
, вы можете, по крайней мере, потерять трубку tr
, которая здесь ничего не дает.
Используйте pdfsam http://www.pdfsam.org/ это очень хорошо для разделения и объединения PDF-файлов
Вы можете использовать pdftk для объединения и изменения документов PDF в целом. В качестве альтернативы есть онлайн-сервис для этого: http://www.pdfmerge.com/
Вот мой подход:
Вот результат:
#!/bin/sh
CLEANED_FILE_PATHS=$(echo $NAUTILUS_SCRIPT_SELECTED_FILE_PATHS | sed 's,.pdf /home/,.pdf\\n/home/,g')
echo $CLEANED_FILE_PATHS | bash -c 'IFS=$'"'"'\n'"'"' read -d "" -ra x;pdfunite "${x[@]}" merged.pdf'
Просто вставьте этот скрипт в
/home/your_username/.local/share/nautilus/scripts
и назовите его «merge_pdfs.sh» (например). Затем сделайте его исполняемым (щелкните правой кнопкой мыши на merge_pdfs.sh -> вкладка «Разрешения» -> отметьте «Разрешить запуск файла как программы»).
Так что теперь, чтобы объединить PDF-файлы, вам просто нужно выбрать их -> щелкните правой кнопкой мыши -> scripts -> merge_pdfs.sh, и он создаст файл «merged.pdf» в том же каталоге
Надеюсь, это поможет!