Как я могу извлечь диапазон страниц / часть PDF?


423

У вас есть идеи, как извлечь часть документа PDF и сохранить его в формате PDF? На OS X это абсолютно тривиально, используя Preview. Я пробовал PDF-редактор и другие программы, но безрезультатно.

Мне нужна программа, в которой я выбираю нужную часть, а затем сохраняю ее в формате PDF с помощью простой команды, такой как CMD+ Nв OS X. Я хочу сохранить извлеченную часть в формате PDF, а не в формате JPEG и т. Д.


Вы пробовали ImageMagick?
Мартин Шредер,

3
Это для растрового изображения мне нужно что-то, что сохраняет в формате PDF!
user72469

3
pdfshufflerв репо.
Марк

2
pdfshufflerбольше не работает в Ubuntu 14.04+. Вы всегда можете использовать диалоговое окно печати или альтернативу на основе терминала, напримерpdfseparate
Rho

@Rho Версия, установленная напрямую через apt-getменя, все еще отлично работает в 16.04. Может быть, они исправили ошибки, если они были?
xji

Ответы:


476

pdftkполезный многоплатформенный инструмент для работы ( домашняя страница pdftk ).

pdftk full-pdf.pdf cat 12-15 output outfile_p12-15.pdf

Вы передаете имя файла основного файла PDF, затем говорите, что он включает только определенные страницы (в данном примере 12-15) и выводит его в новый файл.


6
Если я хочу извлечь страницы 1-10, 15 и 17, как мне написать команду?
Патрик Ли

31
@PatrickLipdftk A=in.pdf cat A1-10 A15 A17 output out.pdf
m8mble

9
Обратите внимание, что pdftkнедоступно в Ubuntu 18.04. (см. askubuntu.com/questions/1028522/… )
alkamid

6
@alkamid это так: sudo snap install pdftk
Qubix,

12
Хотя pdftkэто, безусловно, инструмент, который может сделать эту работу, я бы рекомендовал против этого. Это не свободное программное обеспечение, а неуклюжая часть условно-бесплатного программного обеспечения. Также это нуждается в JVM. Более разумный инструмент qpdf, как предлагается в другом ответе .
оставил около

246

очень просто, используйте программу чтения PDF по умолчанию:

распечатать как файл. это оно! меню печати

тогда

установка нового PDF


12
блестящий флиппин
andybleaden

17
Производит катастрофические результаты с файлами проектора, картами и любыми другими документами, которые не соответствуют формату страницы принтера.
Луис де Соуза

11
Это может привести к созданию файла с гораздо большим размером, чем исходный документ.
Дат

7
поэтому он не «извлекает» диапазон страниц. Он создает новый pdf из старого, как если бы вы использовали пару принтер / сканер высокой четкости.
sylvainulg

6
Хорошо для простых случаев, но нежелательные результаты в документах с выделением комментариев: выделение становится непрозрачным на 100% и блокирует текст.
love.by.Iesus

79

Диапазон страниц - сценарий Наутилус


обзор

Я создал немного более продвинутый скрипт на основе учебника @ThiagoPonte, на который ссылается. Его ключевые особенности

  • что это на основе графического интерфейса,
  • совместим с пробелами в именах файлов,
  • и на основе трех разных бэкэндов, которые способны сохранить все атрибуты исходного файла

Скриншот

введите описание изображения здесь

Код

#!/bin/bash
#
# TITLE:        PDFextract
#
# AUTHOR:       (c) 2013-2015 Glutanimate (https://github.com/Glutanimate)
#
# VERSION:      0.2
#
# LICENSE:      GNU GPL v3 (http://www.gnu.org/licenses/gpl.html)
# 
# OVERVIEW:     PDFextract is a simple PDF extraction script based on Ghostscript/qpdf/cpdf.
#               It provides a simple way to extract a page range from a PDF document and is meant
#               to be used as a file manager script/addon (e.g. Nautilus script).
#
# FEATURES:     - simple GUI based on YAD, an advanced Zenity fork.
#               - preserves _all_ attributes of your original PDF file and does not compress 
#                 embedded images further than they are.      
#               - can choose from three different backends: ghostscript, qpdf, cpdf
#
# DEPENDENCIES: ghostscript/qpdf/cpdf poppler-utils yad libnotify-bin
#                         
#               You need to install at least one of the three backends supported by this script.
#
#               - ghostscript, qpdf, poppler-utils, and libnotify-bin are available via 
#                 the standard Ubuntu repositories
#               - cpdf is a commercial CLI PDF toolkit that is free for personal use.
#                 It can be downloaded here: https://github.com/coherentgraphics/cpdf-binaries
#               - yad can be installed from the webupd8 PPA with the following command:
#                 sudo add-apt-repository ppa:webupd8team/y-ppa-manager && apt-get update && apt-get install yad
#
# NOTES:        Here is a quick comparison of the advantages and disadvantages of each backend:
#
#                               speed     metadata preservation     content preservation        license
#               ghostscript:     --               ++                         ++               open-source
#               cpdf:             -               ++                         ++               proprietary
#               qpdf:            ++                +                         ++               open-source
#
#               Results might vary depending on the document and the version of the tool in question.
#
# INSTALLATION: https://askubuntu.com/a/236415
#
# This script was inspired by Kurt Pfeifle's PDF extraction script 
# (http://www.linuxjournal.com/content/tech-tip-extract-pages-pdf)
#
# Originally posted on askubuntu
# (https://askubuntu.com/a/282453)

# Variables

DOCUMENT="$1"
BACKENDSELECTION="^qpdf!ghostscript!cpdf"

# Functions

check_input(){
  if [[ -z "$1" ]]; then
    notify "Error: No input file selected."
    exit 1
  elif [[ ! "$(file -ib "$1")" == *application/pdf* ]]; then
    notify "Error: Not a valid PDF file."
    exit 1
  fi
}

check_deps () {
  for i in "$@"; do
    type "$i" > /dev/null 2>&1 
    if [[ "$?" != "0" ]]; then
      MissingDeps+="$i"
    fi
  done
}

ghostscriptextract(){
  gs -dFirstPage="$STARTPAGE "-dLastPage="$STOPPAGE" -sOutputFile="$OUTFILE" -dSAFER -dNOPAUSE -dBATCH -dPDFSETTING=/default -sDEVICE=pdfwrite -dCompressFonts=true -c \
  ".setpdfwrite << /EncodeColorImages true /DownsampleMonoImages false /SubsetFonts true /ASCII85EncodePages false /DefaultRenderingIntent /Default /ColorConversionStrategy \
  /LeaveColorUnchanged /MonoImageDownsampleThreshold 1.5 /ColorACSImageDict << /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor 0.4 /Blend 1 >> /GrayACSImageDict \
  << /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor 0.4 /Blend 1 >> /PreserveOverprintSettings false /MonoImageResolution 300 /MonoImageFilter /FlateEncode \
  /GrayImageResolution 300 /LockDistillerParams false /EncodeGrayImages true /MaxSubsetPCT 100 /GrayImageDict << /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor \
  0.4 /Blend 1 >> /ColorImageFilter /FlateEncode /EmbedAllFonts true /UCRandBGInfo /Remove /AutoRotatePages /PageByPage /ColorImageResolution 300 /ColorImageDict << \
  /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor 0.4 /Blend 1 >> /CompatibilityLevel 1.7 /EncodeMonoImages true /GrayImageDownsampleThreshold 1.5 \
  /AutoFilterGrayImages false /GrayImageFilter /FlateEncode /DownsampleGrayImages false /AutoFilterColorImages false /DownsampleColorImages false /CompressPages true \
  /ColorImageDownsampleThreshold 1.5 /PreserveHalftoneInfo false >> setdistillerparams" -f "$DOCUMENT"
}

cpdfextract(){
  cpdf "$DOCUMENT" "$STARTPAGE-$STOPPAGE" -o "$OUTFILE"
}

qpdfextract(){
  qpdf --linearize "$DOCUMENT" --pages "$DOCUMENT" "$STARTPAGE-$STOPPAGE" -- "$OUTFILE"
  echo "$OUTFILE"
  return 0 # even benign qpdf warnings produce error codes, so we suppress them
}

notify(){
  echo "$1"
  notify-send -i application-pdf "PDFextract" "$1"
}

dialog_warning(){
  echo "$1"
  yad --center --image dialog-warning \
  --title "PDFExtract Warning" \
  --text "$1" \
  --button="Try again:0" \
  --button="Exit:1"

  [[ "$?" != "0" ]] && exit 0
}

dialog_settings(){
  PAGECOUNT=$(pdfinfo "$DOCUMENT" | grep Pages | sed 's/[^0-9]*//') #determine page count

  SETTINGS=($(\
      yad --form --width 300 --center \
          --window-icon application-pdf --image application-pdf \
          --separator=" " --title="PDFextract"\
          --text "Please choose the page range and backend"\
          --field="Start:NUM" 1[!1..$PAGECOUNT[!1]] --field="End:NUM" $PAGECOUNT[!1..$PAGECOUNT[!1]] \
          --field="Backend":CB "$BACKENDSELECTION" \
          --button="gtk-ok:0" --button="gtk-cancel:1"\
      ))

  SETTINGSRET="$?"

  [[ "$SETTINGSRET" != "0" ]] && exit 1

  STARTPAGE=$(printf %.0f ${SETTINGS[0]}) #round numbers and store array in variables
  STOPPAGE=$(printf %.0f ${SETTINGS[1]})
  BACKEND="${SETTINGS[2]}"
  EXTRACTOR="${BACKEND}extract"

  check_deps "$BACKEND"

  if [[ -n "$MissingDeps" ]]; then
    dialog_warning "Error, missing dependency: $MissingDeps"
    unset MissingDeps
    dialog_settings
    return
  fi

  if [[ "$STARTPAGE" -gt "$STOPPAGE" ]]; then 
    dialog_warning "<b>   Start page higher than stop page.   </b>"
    dialog_settings
    return
  fi

  OUTFILE="${DOCUMENT%.pdf} (p${STARTPAGE}-p${STOPPAGE}).pdf"
}

extract_pages(){
  $EXTRACTOR
  EXTRACTORRET="$?"
  if [[ "$EXTRACTORRET" = "0" ]]; then
    notify "Pages $STARTPAGE to $STOPPAGE succesfully extracted."
  else
    notify "There has been an error. Please check the CLI output."
  fi
}


# Main

check_input "$1"
dialog_settings
extract_pages

Монтаж

Пожалуйста, следуйте общим инструкциям по установке скриптов Nautilus . Обязательно внимательно прочитайте заголовок сценария, так как это поможет уточнить установку и использование сценария.


Частичные страницы - PDF Shuffler


обзор

PDF-Shuffler - это небольшое приложение python-gtk, которое помогает пользователю объединять или разделять документы PDF и вращать, обрезать и изменять их страницы с помощью интерактивного и интуитивно понятного графического интерфейса. Это интерфейс для python-pyPdf.

Монтаж

sudo apt-get install pdfshuffler

использование

PDF-Shuffler может обрезать и удалять отдельные страницы PDF. Вы можете использовать его для извлечения диапазона страниц из документа или даже частичных страниц, используя функцию обрезки:

введите описание изображения здесь


Элементы страницы - Inkscape


обзор

Inkscape - очень мощный редактор векторной графики с открытым исходным кодом. Он поддерживает широкий спектр различных форматов, включая файлы PDF. Вы можете использовать его для извлечения, изменения и сохранения элементов страницы из файла PDF.

Монтаж

sudo apt-get install inkscape

использование

1.) Откройте файл PDF по вашему выбору с Inkscape. Откроется диалоговое окно импорта. Выберите страницу, с которой вы хотите извлечь элементы. Оставьте остальные настройки такими, какие они есть:

введите описание изображения здесь

2.) В Inkscape нажмите и перетащите, чтобы выбрать элемент (ы), которые вы хотите извлечь:

введите описание изображения здесь

3.) Инвертировать выделение с помощью !и удалить выделенный объект с помощью DELETE:

введите описание изображения здесь

4.) Обрежьте документ до остальных объектов, открыв диалоговое окно « Свойства документа » с помощью CTRL+ SHIFT+ Dи выбрав «подогнать документ к изображению»:

введите описание изображения здесь

5.) Сохраните документ в виде файла PDF из диалогового окна Файл -> Сохранить как :

6.) Если в вашем обрезанном документе есть растровые / растровые изображения, вы можете установить их DPI в следующем диалоговом окне:

введите описание изображения здесь

7.) Если вы выполнили все шаги, вы получите настоящий PDF-файл, который состоит только из объектов по вашему выбору:

введите описание изображения здесь


Большое усилие. Спасибо! Я понимаю, что это не позволяет выделить часть страницы, а только целые страницы. Я прав?
Карнендил

2
@carnendil: Да, именно так. Я не думаю, что ghostscript способен на это. Но могут быть и другие решения, чтобы сделать это программно . На данный момент я отредактировал свой ответ альтернативным (и немного хакерским) решением с использованием PDF-shuffler.
Glutanimate

3
Хорошо, я добавил другой метод, используя Inkscape.
Glutanimate

1
pdfshufflerнедостаточно, если вы хотите извлечь часть страницы PDF. Исходные данные PDF страницы все еще сохраняются в файле. Не используйте этот метод, если вы хотите удалить конфиденциальные данные из файла PDF.
Роб Вт

pdfshufflerсейчас называется pdfarranger.
amoe

70

QPDF отлично. Используйте его таким образом, чтобы извлечь страницы 1-10 input.pdfи сохранить его как output.pdf.

qpdf --pages input.pdf 1-10 -- input.pdf output.pdf

Обратите внимание, что input.pdfнаписано дважды.

Вы можете установить его, вызвав:

sudo apt-get install qpdf

Это отличный инструмент для манипулирования PDF, который очень быстрый, имеет очень мало зависимостей. «Он может зашифровать и линеаризовать файлы, раскрыть внутреннюю часть файла PDF и выполнить множество других операций, полезных для конечных пользователей и разработчиков PDF».

http://sourceforge.net/projects/qpdf/


3
Единственная проблема, с которой я столкнулся, заключается в том, что все страницы в оглавлении все еще перечислены, несмотря на то, что большинство из них было удалено. Кроме того, блестящее спасибо! :)
Уилф

3
Отличное программное обеспечение. Ницца
Анвар

2
Предупреждение. Файлы имеют огромный размер примерно того же размера, что и оригинал.
Кори Аликс

3
Работает, но такой синтаксис для указания страниц (перечисление входного файла дважды, затем добавление --) действительно странный.
Дан Даскалеску

3
Флаг --pages позволяет объединять страницы из нескольких PDF-файлов. Обратите внимание , что вы можете избежать дублирования имя, используя .вместо входного файла в опциях --pages: qpdf --pages . 1-10 -- input.pdf output.pdf.
Барт

43

Сохраните это как скрипт оболочки, например, pdfextractor.sh:

#!/bin/bash
# this function uses 3 arguments:
#     $1 is the first page of the range to extract
#     $2 is the last page of the range to extract
#     $3 is the input file
#     output file will be named "inputfile_pXX-pYY.pdf"
gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dSAFER \
   -dFirstPage="${1}" \
   -dLastPage="${2}" \
   -sOutputFile="${3%.pdf}_p${1}-p${2}.pdf" \
   "${3}"

Для запуска введите:

./pdfextractor.sh 4 20 myfile.pdf
  1. 4 ссылается на страницу, на которой начнется новый PDF.

  2. 20 ссылается на страницу, на которой будет заканчиваться PDF.

  3. myfile.pdf это PDF-файл, который вы хотите извлечь части.

Вывод будет myfile_p4_p20.pdfв том же каталоге, что и оригинальный файл PDF.

Все это и дополнительная информация здесь: Tech Tip


16
Давайте будем простыми:gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dFirstPage=1 -dLastPage=10 -sOutputFile=output.pdf input.pdf
Ho1

и как мне указать входной файл?
Анвар

1
-1 для расширения параметров bash за пределами строки в двойных кавычках. (должно быть "-sOutputFile=${3%.pdf}_p${1}-p${2}.pdf"и т. д. (обратите внимание на кавычки)).
Роцор

1
@ Ho1, пожалуйста, напишите это как новый ответ, это действительно помогает!
Джошуа Салазар

Это самый переносимый ответ, так как ghostscript, вероятно, будет установлен где угодно.
Калимо


27

Существует утилита командной строки, которая называется pdfseparate .

Из документов:

pdfseparate sample.pdf sample-%d.pdf

extracts  all pages from sample.pdf, if i.e. sample.pdf has 3 pages, it
   produces

sample-1.pdf, sample-2.pdf, sample-3.pdf

Или выбрать одну страницу (в данном случае первую страницу) из файла sample.pdf:

pdfseparate -f 1 -l 1 sample.pdf sample-1.pdf

2
отличный инструмент! намного быстрее чемpdftk
Анвар

3
Хорошо, но он ограничен одной страницей, и если вы хотите больше, вы получите отдельные страницы.
Ho1

2
Конечно, можно выполнить приведенную выше команду с помощью pdfunite для создания одного документа.
jdmcbr

3
Если у вас огромный документ и вам нужно разделить все страницы, это действительно быстро и полезно.
МЕДВИС,

19

pdftk( sudo apt-get install pdftk) - отличная командная строка для работы с PDF. Вот несколько примеров того, что pdftkможно сделать:

   Collate scanned pages
     pdftk A=even.pdf B=odd.pdf shuffle A B output collated.pdf
     or if odd.pdf is in reverse order:
     pdftk A=even.pdf B=odd.pdf shuffle A Bend-1 output collated.pdf

   Join in1.pdf and in2.pdf into a new PDF, out1.pdf
     pdftk in1.pdf in2.pdf cat output out1.pdf
     or (using handles):
     pdftk A=in1.pdf B=in2.pdf cat A B output out1.pdf
     or (using wildcards):
     pdftk *.pdf cat output combined.pdf

   Remove page 13 from in1.pdf to create out1.pdf
     pdftk in.pdf cat 1-12 14-end output out1.pdf
     or:
     pdftk A=in1.pdf cat A1-12 A14-end output out1.pdf

   Burst a single PDF document into pages and dump its data to
   doc_data.txt
     pdftk in.pdf burst

   Rotate the first PDF page to 90 degrees clockwise
     pdftk in.pdf cat 1east 2-end output out.pdf

   Rotate an entire PDF document to 180 degrees
     pdftk in.pdf cat 1-endsouth output out.pdf

В вашем случае я бы сделал:

     pdftk A=input.pdf cat A<page_range> output output.pdf

Пакет 'pdftk' не имеет кандидата для установки
FireInTheSky

8

Вы пробовали PDF Mod?

Вы можете, например .. извлечь страницы и сохранить их в формате PDF.

Описание:

PDF Mod - это простой инструмент для изменения PDF документов. Он может вращать, извлекать, удалять
и изменять порядок страниц с помощью перетаскивания. Несколько документов могут быть объединены с помощью перетаскивания
. Вы также можете редактировать заголовок, тему, автора и ключевые слова
документа PDF, используя PDF Mod.

Установить через центр программного обеспечения

Надеюсь, это будет полезно.

Regars.


ДА, я действительно пробовал это, но это НЕ позволяет мне сохранять часть страницы, например, сюжет в формате PDF ... Если я не вижу опцию. Это позволяет мне извлечь целую страницу из документа, но это не то, что я хочу
user72469

Я использую это регулярно, отличный инструмент! но у меня был документ с 170 страницами, который pdfmod не мог обработать.
love.by.Iesus

Ух ты. Это удивительно гладко. Вбросил в нее мою реальную книгу на 512 страниц (50MiB), и она ... была быстрой. Интерфейс это бриз. Для наркомана CLI, такого как я, требуется некоторый уровень графического интерфейса, чтобы убедить меня, но это подойдет!
Сех

PDF Мод работает с ошибками в Kubuntu 18
Джошуа Салазар

8

Я пытался сделать то же самое. Все, что вам нужно сделать, это:

  1. установить pdftk:

    sudo apt-get install pdftk
    
  2. если вы хотите извлечь случайные страницы:

    pdftk myoldfile.pdf cat 1 2 4 5 output mynewfile.pdf
    
  3. если вы хотите извлечь диапазон:

    pdftk myoldfile.pdf cat 1-2 4-5 output mynewfile.pdf
    

Пожалуйста, проверьте источник для получения дополнительной информации.


Я считаю этот ответ лучшим, потому что он показывает, как вы можете ввести несколько диапазонов.
Роман Луштрик

6

Как оказалось, я могу сделать это с imagemagick. Если у вас его нет, просто установите:

sudo apt-get install imagemagick

Примечание 1 : я попробовал это с одностраничным PDF (я учусь использовать imagemagick, поэтому я не хотел больше проблем, чем необходимо). Я не знаю, будет ли / как он будет работать с несколькими страницами, но вы можете извлечь одну интересующую страницу с помощью pdftk:

pdftk A=myfile.pdf cat A1 output page1.pdf

где вы указываете номер страницы, которая будет выделена (в примере выше, A1выбирается первая страница).

Примечание 2 : Полученное изображение с использованием этой процедуры будет растровым.


Откройте pdf с помощью команды display, которая является частью imagemagickпакета:

display file.pdf

Моя выглядела так:

imagemagick отображение PDF
Нажмите на изображение, чтобы увидеть версию с полным разрешением

Теперь вы нажимаете на окно, и меню всплывает в сторону. Там выберите Transform | Crop .

imagemagick transform> обрезать меню

Вернувшись в главное окно, вы можете выбрать область, которую хотите обрезать, просто перетащив указатель (классический выбор от угла к углу).

выбор участка для обрезки
Обратите внимание на указатель в форме руки вокруг изображения при выборе

Этот выбор можно уточнить, прежде чем перейти к следующему шагу.

Как только вы закончите, обратите внимание на маленький прямоугольник, который появляется в верхнем левом углу (см. Изображение выше). Он показывает размеры области, выбранной сначала (например 281x218), а затем координаты первого угла (например +256+215).

Запишите размеры выбранной области; он понадобится вам в момент сохранения обрезанного изображения.

Теперь, вернувшись в всплывающее меню (которое теперь является определенным «обрезанным» меню), нажмите кнопку « Обрезать» .

меню кадрирования

Наконец, как только вы будете удовлетворены результатами обрезки, нажмите на меню Файл | Сохранить

Перейдите в папку, в которую вы хотите сохранить обрезанный файл PDF, введите имя, нажмите кнопку « Формат» , в окне «Выберите тип формата изображения» выберите PDF и нажмите кнопку « Выбрать» . Вернувшись в окно «Обзор и выбор файла», нажмите кнопку « Сохранить» .

imagemagick сохранить в формате pdf

Перед сохранением imagemagickпопросим «выбрать геометрию страницы». Здесь вы вводите размеры вашего обрезанного изображения, используя простую букву «х» для разделения ширины и высоты.

imagemagick выбрать геометрию страницы

Теперь вы можете сделать все это отлично из командной строки (команда convertс опцией -crop) - конечно, это быстрее, но вам нужно заранее знать координаты изображения, которое вы хотите извлечь. Проверьте man convertи пример на их веб-странице .


Я не знал о графическом интерфейсе ImageMagick. Выглядит интересно. Однако, пожалуйста, поправьте меня, если я ошибаюсь, но я думаю, что imagemagick не может обрабатывать векторизованные изображения. Поэтому то, что вы экспортируете, скорее всего, будет только растровым / растровым изображением. В этом случае этот метод аналогичен созданию снимка области документа.
Glutanimate

1
Действительно, imagemagickработает только растровые изображения, и displayэто только одна команда из набора. Есть много интерфейсов для imagemagick- проверьте их веб-страницу. Я думаю, что для векторных изображений лучшим решением будет ваш метод с Inkscape.
Карнендил

2
Возможно, вы захотите добавить отказ от ответственности в верхней части ответа, чтобы предупредить, что это преобразует векторную графику в растровую. Это свойство делает его принципиально другим подходом.
bluenote10

2

PDF Split and Merge весьма полезен для этой и других операций с PDF.

Скачать отсюда


1
Вы можете скачать последнюю версию по ссылке выше, но если вы предпочитаете удобство Центра программного обеспечения, вы также можете установить его оттуда (или с терминала, через sudo apt-get install pdfsam). Тем не менее, версия в Ubuntu довольно устарела, так как она все еще в версии 1.1.4, тогда как версия sourceforge уже 2.2.2.
Вальдир Леонсио

Последний 3.x (в настоящее время 3.1.0) имеет пакет .deb, который может быть установлен в Ubuntu, и имеет модуль Extract Pages, который выполняет то, что просил OP
Andrea Vacondio

1
@ Андрея Vacondio Bravo за отличное редактирование! Вы помогаете сделать Интернет безопасным. Я обнаружил, что файл со старой ссылки на sourceforge.net содержит в себе дерьмо. Новые владельцы сайта SourceForge заявили, что собираются прекратить это делать, но, очевидно, они лгали.
Карел

2

Поскольку первоначальный пользователь попросил интерактивный инструмент, а не инструмент командной строки: простое решение - это использовать любой просмотрщик PDF (обычно в Kubuntu, evince или даже Firefox в Ubuntu), а затем просто использовать стандартный диалог печати, выбрать «печать в PDF-файл », а затем выберите в расширенном диалоговом окне настроек, какие страницы« распечатать ». Этот вариант имеет некоторые недостатки, так как некоторые уловки в исходном PDF-файле (например, повернутые страницы, формы и т. Д.) Могут быть потеряны, но он работает просто для большинства простых PDF-файлов.


0

Если вы хотите извлечь из ваших PDF-файлов, вы можете использовать http://www.sumnotes.net . Это удивительный инструмент для извлечения заметок, основных моментов и изображений из PDF-файлов. Вы также можете посмотреть учебники на Youtube, набрав sumnotes.

Я надеюсь, вам понравится!

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.