Есть ли способ увеличить контраст PDF, созданного путем сканирования фотокопии в BW


16

Я попытался открыть меню «Доступность» и выбрать черный фон с зеленым шрифтом, но, похоже, это не работает, если документ был первоначально отсканирован в черно-белом режиме. Есть ли другой способ улучшить контраст PDF?


2
Если вы не запустили OCR на сканере, текста нет, только изображение текста, поэтому никакие настройки, связанные с текстом, ни на что не повлияют.
fixer1234

2
Извлекайте изображения (отсканированные страницы) из PDF, используйте некоторые манипуляции с изображениями для повышения контрастности, помещайте изображения обратно. Я не знаю ни одного средства просмотра PDF, которое позволяло бы вам напрямую управлять контрастом изображения.
Деркт

Ответы:


13

Если в нем много страниц, более простым инструментом является командная строка: http://www.imagemagick.org/script/download.php

(ImageMagick - очень популярная библиотека для работы с изображениями.)

Вам придется сделать три шага.

  1. Преобразование страниц PDF в отдельные файлы изображений. См .: Преобразование PDF в изображение с высоким разрешением или Преобразование PDF в изображения JPG с помощью ImageMagick - как присвоить имена файлам 0?

    convert -density 600 your_pdf_filename.pdf  output-%02d.jpg
    
  2. Отрегулируйте качество изображения. Если у вас всего несколько страниц, Photoshop или GIMP (бесплатная альтернатива Photoshop с открытым исходным кодом) просто импортируют каждую страницу в виде изображения. Обновите контрастность по своему желанию и сохраните. Для получения дополнительной информации см. Gimp: как удалить фоновый шум / артефакты и улучшить рукописный текст или продолжать использовать ImageMagick: пакетная обработка изображений документов, чтобы выглядеть как факс

    convert output*.jpg -normalize -threshold 80% final-%02d.jpg
    
  3. Если вы хотите PDF обратно:

    convert final*.jpg my_new_highcontrast.pdf
    

1
Проблема в том, что если у вас есть много закладок в PDF, они все потеряны.
bgmCoder

@bgmCoder хорошая мысль. Переход от pdf к изображениям и обратно к pdf по существу убьет каждую отдельную функцию PDF, кроме самого содержимого. Даже чистый текст станет изображением. Но вопрос был о PDF, созданном с помощью сканирования, поэтому я предположил, что в любом случае в нем будут только изображения.
GCB

На окнах команда magick convertвместо convert. Кроме того, Ghostscript должен быть установлен, в противном случае вы получите FailedToExecuteCommand gswin32c.exe The system cannot find the file specified.
OrangeSherbet

3

У меня есть PDF с большим количеством серых изображений (манга). Поэтому я использовал ответ gcb , изменив 2-ю команду на:

convert output.jpg -level 25% output_contrast.jpg

Просто измените процентное значение уровня на то, что служит вам.


Наблюдение.

С помощью arg -thresholdвы получите «черно-белое» (только) изображение. Но я хочу сохранить серую шкалу, что возможно с помощью arg -level: вы сохраняете серый, позволяя изображению с darkerили lighterсерой шкалой.


Порядок команд будет:

convert your_pdf_filename.pdf output-%02d.jpg
convert output*.jpg -level 25% final-%02d.jpg
convert final*.jpg very_readable.pdf

1
Так в чем же преимущество этого варианта по сравнению с ответом gcb?
Блэквуд

1
С «порогом» вы получите «черно-белое» (только) изображение. С помощью «уровня» вы сохраняете серый цвет, позволяя ему «темнее» или «светлее»
Зак

1
Это было бы хорошей информацией для редактирования в вашем ответе.
Blackwood

1
Параметр -level принимает одно, два или три числа, разделенных запятой. Например - уровень 30%, 100%, 0,3. Первый - «уровень черного», следующий - «уровень белого» и, наконец, «гамма». Любой пиксель темнее 30% становится черным, а пиксель ярче 100% становится белым, и затем для промежуточных значений применяется нелинейное степенное преобразование с гаммой = 0,3 (гамма = 1,0 означает линейное, без преобразования). Используйте одно изображение, чтобы быстро поиграться с параметрами, чтобы получить желаемый результат.
OrangeSherbet

2

Nuance Paperport имеет возможность увеличить контраст на отсканированных страницах PDF.

Бесплатное программное обеспечение NAPS2 также может делать это либо в сочетании со сканированием, либо после импорта отсканированной страницы. NAPS2 также имеет другие функции, например, для обрезки и автоматического перетаскивания отсканированной страницы. На моей машине (Core i5, 8 ГБ) импорт немного медленный, но редактирование страницы работает нормально.


NAPS2 прекрасно работает - это достаточно просто и интуитивно понятно, но если у вас есть закладки в PDF, они все будут потеряны.
bgmCoder

1

Вы можете конвертировать PDF в JPG онлайн . Настройте картинки в редакторе фотографий. Я использовал Adobe Lightroom, чтобы настроить контраст на нескольких фотографиях одновременно с синхронизированными настройками, чтобы сэкономить время. Затем конвертируйте JPG в PDF онлайн


1

Если вам не нравится Image Magick и командная строка и вы хотите больше контролировать процесс, я предлагаю использовать Foxit PdfPhantom (Business Version) вместе с Adobe Photoshop. Вы можете просто конвертировать PDF в любой формат изображения, который вы хотите с Foxit на вкладке Convert . Затем вы можете использовать Photoshop, чтобы применить определенную последовательность операций к серии фотографий. Для этого смотрите этот учебник . Наконец, вы можете вернуться к PDF с помощью Foxit.


0

Я не думаю, что кто-либо из просмотрщиков PDF имеет встроенные фильтры или настройки для изображений, только для фонов и цветов шрифтов.

Вы можете настроить свой монитор и / или если программное обеспечение вашей видеокарты поддерживает его, отрегулируйте видеокарты, настройки видео. Сохраните настройки видео в профиле, чтобы использовать его снова, для этого было бы неплохо.

Вы можете распечатать его и настроить принтер (большинство настроек принтера позволяют регулировать).
Вы можете захватить экран, затем вставить его в редактор изображений / фотографий и настроить.
Если у вас «разрешено» и есть программа для создания PDF, вы можете исправить каждое использованное изображение и переделать его.
Если у вас есть программа Adobe Photoshop, некоторые ее версии открывают PDF, я не знаю, что она может сделать.

См. Также Настройка контраста PDF с помощью Adobe Reader / Acrobat?
Он имеет несколько очень хороших и простых ответов, если PDF не заблокирован.

Вы не указали, является ли это одна картинка или много, которые могли бы помочь с вопросом. Вы не указали операционную систему (даже тег для нее работает). добавление этой информации к вопросу улучшит способность отвечать.


0

Для Windows я написал командный файл .batдля автоматической генерации PDF при перетаскивании в командный файл. (Linux / OSX потребует перевода этого в сценарий оболочки)

Сначала вам нужно установить ImageMagick (разрешить установщику добавлять в PATH, чтобы он magick convertработал из командной строки) и установить GhostScript. Не волнуйтесь, их легко установить.

Вот командный файл. Создайте файл pdf_darkener.batсо следующим содержимым:

@echo off
echo Darkening the pdf at %1 
echo Converting PDF to JPGs...
magick convert -density 500 %1 darken_pdf_preprocess_%%02d.jpg
echo Darkening JPGs...
magick convert darken_pdf_preprocess*.jpg -level 50%%,100%%,0.3 darken_pdf_postprocess_%%02d.jpg
echo Converting JPGs to PDF...
magick convert darken_pdf_postprocess*.jpg darkened.pdf
echo Deleting JPGs...
del darken_pdf_*.jpg
echo Done!
pause

Перетащите любой PDF-файл в командный файл. Дождитесь завершения операций (медленность / уровень детализации контролируется density 500, чем больше = больше пикселей, тем больше размер файла, медленнее). Выходной pdf будет в той же директории, что и исходный pdf. Пакетный файл очищается после себя, удаляя промежуточные jpgs, созданные во время обработки.

введите описание изображения здесь

введите описание изображения здесь

Обратите внимание, что эта операция по увеличению контрастности контролируется тремя числами: 50%%,100%%,0.3что означает 50%, 90% и 0,3. Это black_level, white_level и gamma, согласно документации ImageMagick. black_level - это процент яркости, ниже которого все отображается на чистый черный, наоборот для белого. Гамма управляет нелинейным отображением промежуточных значений (1,0 является линейным).

Пожалуйста, поделитесь любыми улучшениями или полезными модификациями в разделе комментариев.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.