Как объединить несколько файлов PDF на одной странице с pdftk?


35

У меня есть ряд PDF - файлов 1.pdf, 2.pdfи т.д. , что я хотел бы объединить в один файл, со всеми PDF - черепичных на одной странице.

В настоящее время я попытался pdftkобъединить эти файлы, но они размещены на отдельных страницах:

pdftk 1.pdf 2.pdf ... cat output merged.pdf

Можно ли вместо этого сгруппировать отдельные файлы PDF в одну главную страницу merged.pdf?


1
В случаях, когда использование приложения с графическим интерфейсом в порядке, хорошей альтернативой является pdfsam.org
reinierpost

1
Вы нашли какой-нибудь ответ, чтобы принять?
Лео Леопольд Герц

Эта ссылка: verypdf.com/wordpress/201302/… показывает, что VeryPDF PDF Stitcher может выполнять работу вертикально или сбоку. Скачать по адресу: verypdf.com/app/pdf-stitch/index.html
Зимба

Ответы:


29

Я проверял это сегодня:

pdfjam Page1.pdf Page2.pdf --nup 2x1 --landscape --outfile Page1+2.pdf

Это помещает 2 страницы на одну страницу.


работает и под windows (с wsl )sudo apt-get install pdfjam
jan-

4
если вы хотите склеивать страницы по вертикали, используйте--nup 1x2 --no-landscape
jan-

Если вы не хотели автоматически масштабировать страницы (по умолчанию мой растягивает вывод, чтобы заполнить a4), используйте--noautoscale true
Jonathan Y.

1
Вопрос о pdftk, а не о pdfjam. Это не отвечает на вопрос; это предложение, чтобы найти альтернативу
Зимба

6

Pdfnup на основе pdfLaTeX может работать для вас. Если у вас много pdf-файлов, вам может понадобиться создать длинный канал pdfjam или запустить его несколько раз.

Существует также pdfnup в Python .


4

Не уверен, что вы имеете в виду tiled on one page. Я искал способ объединить несколько PDF-файлов на одной странице - поверх другой. Это можно сделать pdftkтак:

pdftk foreground.pdf background background.pdf output merged.pdf


3

Этот скрипт будет отображать страницы PDF для вас. Измените срез на то, что вам нужно на странице.

#!/usr/bin/ruby

latexhead = <<'EOF'
\documentclass{article}
\usepackage[pdftex]{graphicx}
\usepackage[margin=0.1in]{geometry}
\usepackage{pdfpages}
\begin{document}
EOF
latextail = <<'EOF'
\end{document}
EOF

pages = %x[pdfinfo #{ARGV[0]}].split(/\n/).select{|x| x=~ /Pages:/}[0].split(/\s+/)[1].to_i
puts latexhead
s = (1..pages).each_slice(4).to_a
s.each do |a|
  puts "\\begin{figure}"
  a.each do |p|
    puts "\\includegraphics[page=#{p},scale=0.4,width=.5\\textwidth]{#{ARGV[0]}}"
  end
  puts "\\end{figure}"
end
puts latextail

1

Вы можете использовать монтаж из ImageMagick

$ montage *.pdf merged.pdf

см. также http://www.imagemagick.org/script/montage.php


13
Монтаж ImageMagick не будет правильно обрабатывать векторизованные изображения и шрифты. В результате выходные данные команды montage могут выглядеть размытыми. Смотрите также объяснение здесь: superuser.com/a/479767/149568
Бенедикт Кеппел

1
Это НЕ отвечает на вопрос, который задает о pdftk
Зимба

0

Если имена файлов расположены в «системном» порядке, то pdftk *.pdf cat output merged.pdf должно работать нормально.

Вот что я имею в виду под «системным» порядком.

Пример:
у меня в Ubuntu 11.04 есть 3 файла: 1.pdf, 2.pdf, 10.pdf
Файлы объединяются в следующем порядке: 10.pdf 1.pdf 2.pdf ( ls -lвозвращается тот же порядок, что и в объединенном файле)

Самое безопасное соглашение об именах: 0001.pdf, 0002.pdf и т. Д.


1
Как я уже говорил, эта команда создает многостраничный PDF. Как указано в моем вопросе, я ищу метод использования pdftkдля создания одностраничного PDF-файла, который содержит входные PDF-файлы в виде листов.
Алекс Рейнольдс

Объедините мой ответ с @ micke's. Я не проверял, может ли pdfnup принимать имя с подстановочным знаком (* .pdf) в качестве аргумента, но вы можете использовать pdf, сгенерированный pdftk. Проверьте pdfnupили pdfjamс --nupопцией.
Семек

Если вы не заключите их в кавычки, символы подстановки *будут расширяться используемой оболочкой. pdfnupникогда не видит *.pdf, вместо этого он видит список всех файлов в рабочем каталоге с именами файлов, заканчивающимися на .pdf.
evilsoup

0

Если у вас есть большое количество PDF-файлов в одной структуре папок, и у вас есть TeX-Installation, этот скрипт рекурсивно помещает все PDF-файлы в один большой файл:

    #!/bin/bash
#
# pdfdir OUTPUT_FILE
#
# produces one big PDF file of all PDF files in .
#
if [ $# -ne 1 ] || [ -z "$1" ]; then
  echo "Syntax: pdfdir OUTPUT_FILE"
  exit 1
fi
FILE="$(echo "$1"|sed -e 's/\.\(pdf\|tex\)$//')"
for F in "$FILE" "$FILE.tex" "$FILE.pdf" "$FILE.aux" "$FILE.log" ; do
  if [ -e "$F" ]; then
    echo "$F exists already."
    exit 2
  fi
done
cat >"$FILE.tex" <<EOF
\documentclass{article}%
\usepackage{pdfpages}%
\usepackage{grffile}%
\listfiles%
\begin{document}%
%\tableofcontents%
EOF
# helper functions
exist_pdf_files () {
  [ $(find -L "$1" -name \*.pdf -o -name \*.PDF -type f 2>/dev/null|wc -l) -eq 0 ] && return 1
  return 0
}
list_directories () {
  find -L "$1" -maxdepth 1 -mindepth 1 -type d 2>/dev/null | sort
}
list_pdf_files () {
  # version with " around filenames:
  #find -L "$1" -maxdepth 1 -mindepth 1 -name \*.pdf -o -name \*.PDF -type f 2>/dev/null | sort | \
  #  sed -e 's/^/\\includepdf[pages=-]{"/; s/$/"}%/'
  # version without " around filenames:
  find -L "$1" -maxdepth 1 -mindepth 1 -name \*.pdf -o -name \*.PDF -type f 2>/dev/null | sort | \
    sed -e 's/^/\\includepdf[pages=-]{/; s/$/}%/'
}
tex_headline () {
    echo "$1" | sed -e 's/_/\\_/g'
}
# current folder (lefel 0):
list_pdf_files . >>"$FILE.tex"
# Bearbeite Ebene 1:
list_directories . | while read -r DIR1; do
  # Are there PDFs in folders below that level?
  exist_pdf_files "$DIR1" || continue
  # Yes ...
  tex_headline "\section{${DIR1##*/}}%"
  # those:
  list_pdf_files "$DIR1"
  # Level 2:
  list_directories "$DIR1" | while read -r DIR2; do
    exist_pdf_files "$DIR2" || continue
    tex_headline "\subsection{${DIR2##*/}}%"
    list_pdf_files "$DIR2"
    # Level 3:
    list_directories "$DIR2" | while read -r DIR3; do
      exist_pdf_files "$DIR3" || continue
      tex_headline "\subsubsection{${DIR3##*/}}%"
      list_pdf_files "$DIR3"
      # Level 4:
      list_directories "$DIR3" | while read -r DIR4; do
        exist_pdf_files "$DIR4" || continue
        tex_headline "\paragraph{${DIR4##*/}}%"
        list_pdf_files "$DIR4"
        # Level 5:
        list_directories "$DIR4" | while read -r DIR5; do
          exist_pdf_files "$DIR5" || continue
          tex_headline "\subparagraph{${DIR5##*/}}%"
          list_pdf_files "$DIR5"
        done
      done
    done
  done
done >>"$FILE.tex"
echo "\end{document}%" >>"$FILE.tex"
echo "Sourcecode to PDF directly [J/n]"
read -r ANSWER
case "$ANSWER" in
[JjYy]) ;;
*) exit 0 ;;
esac
pdflatex "$FILE"
[ $? -eq 0 ] && rm -f "$FILE.aux" "$FILE.log" "$FILE.tex"

Я не написал этот код, я получил его из обсуждения здесь: http://www.listserv.dfn.de/cgi-bin/wa?A2=ind1201&L=tex-dl&T=0&P=10771

Это очень полезно. Я перевел некоторые немецкие комментарии на английский.

С уважением, Александр



-1
  1. Сохраняйте нужные страницы в PDF-документ с помощью чего-то вроде Acrobat Pro.

  2. Распечатайте документ, используя несколько страниц, для функции страницы, обратно в документ PDF.

Несколько страниц на одной странице. :-)


Я вижу, что ваш ответ отклонен без комментариев. Это не круто, но, безусловно, есть способы улучшить свой ответ. Улучшите его грамматику, добавьте описание сверху, чтобы

проголосовал за этот ответ - только потому, что отрицательные отзывы без комментариев не круто ИМО!
Джереми Дэвис

1
Понижено, потому что тема говорит "с pdftk". Возможно, ваш ответ не о теме, но явно не о том, что ищет спрашивающий.
Ник
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.