2
Фильтрация своего рода «полутонового» изображения для обработки распознавания
У меня есть отсканированный PDF-материал, к которому я хочу добавить скрытый текстовый слой, чтобы я мог проиндексировать документ. Я использовал устройство вывода черного и белого tiff ghostscript (tiffg4) для извлечения страниц в виде изображений tiff, и вот пример того, как они выглядят: Обработка этого изображения с помощью тессеракта не дает …