Как разделить пополам отсканированный PDF-файл на две страницы за один проход?


48

У меня есть отсканированный курс, и он состоит из двух страниц, которые отображаются последовательно как одна страница, как я могу автоматически разделить все страницы за один проход. Обычно это делается путем обрезки нечетных и четных страниц, а затем их объединения, но это может занять очень много времени?

Как разделить страницы на отсканированном PDF за один проход?

Ответы:


28

Посмотрев некоторые ответы в Интернете (это часто задаваемый вопрос), я обнаружил, что это можно легко сделать, используя Posterопцию из Printменю.

Шаги (для Adobe Acrobat XI):

  1. Выберите Printиз Fileменю илиCtrl+P
  2. Выбрать Printerкак Adobe PDF
  3. Выберите Posterвкладку.
  4. Изменить Overlapна 0дюйм
  5. Отрегулируйте в соответствии Tile scaleс вашими потребностями: 100% (99%), если размер напечатанной страницы PDF соответствует текущему размеру страницы PDF, 75%, если размер напечатанной страницы PDF равен половине текущего размера PDF. Повторите с процентами "масштаб плитки", если необходимо, чтобы получить желаемый результат. Чтобы проверить размер напечатанного PDF-документа, перейдите справа от поля Propertiesсо Adobe PDF Page Sizeсписком «Adobe PDF» и при необходимости измените его .
  6. Вы можете нажать Printкнопку, когда страница выглядит разделенной, как вы хотели, отметьте пунктирную линию в предварительном просмотре:

введите описание изображения здесь

Вот экран печати для описанных настроек:

введите описание изображения здесь


Обратите внимание, что этот очень хороший метод будет работать только в Windows, так как на Mac больше невозможно «печатать» в PS / PDF с помощью диалогового окна печати (причина: Apple изменила что-то в OSX, что подавляет ранее используемый рабочий процесс в Acrobat) ,
Макс Висс

3
Существует обходной путь, но он определенно не для слабонервных, и «не следует делать дома» (распечатайте на неподключенный принтер PostScript, затем перехватите файл спула и загрузите его в Distiller).
Макс Висс

1
@MaxWyss Не могли бы вы дать более подробную информацию об обходном пути?
Хайро Бочи

2
@JairoBochi: Как описано, вы создаете универсальный принтер PDF (в Системных настройках принтера и сканера), выбираете его и «печатаете» на этом принтере. В / var / spool / вы найдете файлы спулинга, которые затем можете стучать. Вы должны быть su, чтобы получить доступ к этим файлам. Примечание: для Windows это не обязательно, поскольку драйвер принтера AdobePS по-прежнему работает правильно.
Макс Висс

1
Я не смог создать «универсальный принтер PDF» в Mac OS, как вы описали, но я смог распечатать на своем обычном принтере, а затем поставить его на паузу, прежде чем что-то действительно напечаталось. Я нашел большой недавно созданный файл в / var / spool / cups, и это был мой документ. Благодарность!
bugloaf

28

Есть отличный, бесплатный инструмент с открытым исходным кодом под названием Briss . Это очень просто, удобно и эффективно. Он работает на нескольких операционных системах через Java.

Загрузите ваш PDF в приложение. Приложение сгруппирует похожие страницы и положит их друг на друга. Нарисуйте прямоугольники поверх ваших страниц, чтобы они покрывали то, что вы хотите включить. Это будет выглядеть так:

введите описание изображения здесь

Даже если ваш PDF имеет несколько категорий макета в одном документе, Briss справится с этим. Например, скажем, некоторые части в портретной, а другие в альбомной. Briss сгруппирует их по разным категориям и позволит вам нарисовать на них разные прямоугольники, а затем обработать все это за один проход в один документ. Брисс очень хорошо решает, какие страницы должны быть сгруппированы. Как правило, у меня уходит меньше минуты ручной работы, чтобы начать работу с Бриссом. Таким образом, документ за сотни или даже тысячи страниц может быть сделан за пару минут благодаря этой замечательной программе.

Когда все выглядит хорошо, выберите « Действие» , затем « Обрезать PDF» .

Поистине очень аккуратный инструмент.

Примечание: я понимаю, что этот ответ звучит так, будто я разработчик Briss или что-то в этом роде, но на самом деле это не так Я просто люблю инструмент.


2
Этот инструмент поразителен, почти все, что я мог попросить, чтобы справиться с грязным сканированием - даже сканирование документов, которые по непоследовательности объединяют две страницы в одно изображение, затем только одну страницу, затем две снова. Спасли меня часы.
PatKilg

16

Sejda.com может разделить отсканированные документы PDF пополам , посередине. Работает на всех настольных платформах.

Вот кратко как:

Как разделить отсканированные документы PDF пополам с Sejda.com

Если это отсканированный буклет, и страницы уже не в своем естественном порядке, он также может изменить их порядок для вас.

Я разработчик проекта. Открытый исходный код .


1
Behtareen! Лучшее приложение, которое я когда-либо использовал для задач PDF ...
Саад Рехман Шах

только одна жалоба - она ​​не позволяет вырезать некоторые границы, такие как Брисс,
akostadinov

Вы можете вырезать границы во втором проходе, используя инструмент кадрирования: sejda.com/crop-pdf
Edi


4

Есть две проблемы с автоматизацией разделения отсканированных книг за один проход:

  • Автоматизация не всегда точность
  • Создание удобной для чтения отсканированной книги - это больше, чем просто разделение страниц

Для всего, что связано со сканированными книгами, я настоятельно рекомендую использовать ScanTailor . Он имеет такие функции, как:

  • Переверните перекошенные страницы вертикально,
  • Выберите контент, чтобы уменьшить размер страницы,
  • Увеличение / уменьшение маржи (для заметок, может быть),
  • Отбелите результат для лучшего опыта чтения.

Смотреть учебное видео ≫

Вы должны экспортировать PDF в изображения, чтобы использовать это, и рекомбинировать выходные изображения обратно. Обработанные изображения могут быть очень маленькими по размеру файла (до 6% от исходного), но отличного качества.

Из своего GitHub :

Scan Tailor является свободным программным обеспечением (которое представляет собой нечто большее, чем просто бесплатное программное обеспечение). Он написан на C ++ с Qt и выпущен под лицензией General Public License версии 3. Мы разрабатываем версии для Windows и GNU / Linux.

Также есть форк: ScanTailor Advanced

Чтобы выполнить задачу удовлетворительно, я рекомендую вам использовать PDF-Xchange Viewer для извлечения изображений и добавления OCR, i2pdf для объединения выходов. По моему опыту, вы можете установить самое низкое качество JPG, и оно не будет сильно отличаться, но у вас есть компромисс между размером конечного результата и качеством изображения. Все программы бесплатны. Весь процесс занимает около 1 часа в фоновом режиме, с периодическими проверками.

У меня также есть полное руководство по обработке отсканированных книг, вы можете проверить его: полное руководство по обработке отсканированных книг .


К вашему сведению: Как создавать иерархические закладки на отсканированных файлах PDF?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.