Вопросы с тегом «ocr»

Оптическое распознавание символов (OCR) - это процесс преобразования изображений текста в текст, которым можно управлять с помощью текстовых процессоров и т. Д.

2
DjVu скрытый текст → PDF?
Есть ли способ сделать PDF только из слоя скрытого текста файла DjVu? Я умею пользоваться djvused myfile.djvu -e 'output-txt' > myfile.dsed вывести сценарий DjVu, который включает координаты x, y каждого слова каждой страницы, но как мне преобразовать это в PS или PDF? Я уверен, что у кого-то есть сценарий. Файл …
2 pdf  ocr  djvu 

5
Как получить скриншот лучшего качества для оптического распознавания символов?
Я пытаюсь получить некоторые данные в текстовый файл из скриншотов. Очевидно, что снимки экрана не очень хорошо работают с OCR, потому что они имеют разрешение 75 точек на дюйм, а минимальное значение для хорошего качества распознавания составляет 150 точек на дюйм. Кто-нибудь знает хороший способ сделать скриншоты для OCR? Прямо …
2 screenshot  ocr 

2
Как избежать искажения результатов с помощью инструмента OCR pdfsandwich?
Обычно отсканированные страницы должны быть выровнены до применения инструмента OCR. Здесь мой вход - это страница с прямым сканированием, а выходной сигнал OCR иногда искажается, по часовой стрелке или против часовой стрелки. В моем случае использования английской книги на 260 страниц это происходит на 14 страницах. Пример: input.pdf: output.pdf Команда: …

1
Удаление нетекстового текста из отсканированного файла OCRd PDF
У меня есть PDF, созданный из отсканированного документа. OCR был использован для распознавания текста. В Acrobat, если я выделю текст и нажму «копировать с форматированием», я могу вставить форматированный текст в Word, поэтому кажется, что шрифты и цвета также встроены в документ в дополнение к обычному тексту и, возможно, к …
1 pdf  ocr 

1
Оцифровать учебник
Как я могу оцифровать свой учебник по физике? Он огромный, и я не хочу резать позвоночник. Я видел картину этого: Ion Audio Я хочу знать, что самое важное, когда я делаю свое. У меня есть цифровая камера, и у меня есть огни. Я думал о том, чтобы сделать фильм о …

1
AutoHock для поиска изображений
Я изучаю, как использовать autohotkey, и я хотел создать скрипт, который открывает игру из Steam и автоматически подключается к определенному серверу. Мой код до сих пор: F1:: Run, steam://rungameid/346110 Sleep, 15000 <--- This is more or less the time that my computer takes to load it, and I want another …

1
Как извлечь текст из PDF-файла на основе изображений с помощью Cuneiform в терминале
клинопись -l рус -f текст -o outocr.txt input.pdf Приведенная выше команда при запуске в терминале выводит только текст моей титульной страницы PDF в файл outocr.txt. Что я должен сделать, чтобы он распознал весь текст в 120-страничном PDF? Я использую Fedora Linux 25 (x86_64).
linux  pdf  fedora  ocr 
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.