Пользователи компьютеров ocr

2

Есть ли способ сделать PDF только из слоя скрытого текста файла DjVu? Я умею пользоваться djvused myfile.djvu -e 'output-txt' > myfile.dsed вывести сценарий DjVu, который включает координаты x, y каждого слова каждой страницы, но как мне преобразовать это в PS или PDF? Я уверен, что у кого-то есть сценарий. Файл …

2 pdf ocr djvu

5

Как получить скриншот лучшего качества для оптического распознавания символов?

Я пытаюсь получить некоторые данные в текстовый файл из скриншотов. Очевидно, что снимки экрана не очень хорошо работают с OCR, потому что они имеют разрешение 75 точек на дюйм, а минимальное значение для хорошего качества распознавания составляет 150 точек на дюйм. Кто-нибудь знает хороший способ сделать скриншоты для OCR? Прямо …

2 screenshot ocr

2

Как избежать искажения результатов с помощью инструмента OCR pdfsandwich?

Обычно отсканированные страницы должны быть выровнены до применения инструмента OCR. Здесь мой вход - это страница с прямым сканированием, а выходной сигнал OCR иногда искажается, по часовой стрелке или против часовой стрелки. В моем случае использования английской книги на 260 страниц это происходит на 14 страницах. Пример: input.pdf: output.pdf Команда: …

1 pdf scanning ocr tesseract-ocr

1

Удаление нетекстового текста из отсканированного файла OCRd PDF

У меня есть PDF, созданный из отсканированного документа. OCR был использован для распознавания текста. В Acrobat, если я выделю текст и нажму «копировать с форматированием», я могу вставить форматированный текст в Word, поэтому кажется, что шрифты и цвета также встроены в документ в дополнение к обычному тексту и, возможно, к …

1 pdf ocr

1

Оцифровать учебник

Как я могу оцифровать свой учебник по физике? Он огромный, и я не хочу резать позвоночник. Я видел картину этого: Ion Audio Я хочу знать, что самое важное, когда я делаю свое. У меня есть цифровая камера, и у меня есть огни. Я думал о том, чтобы сделать фильм о …

video-editing ocr scanning pictures digitization

1

AutoHock для поиска изображений

Я изучаю, как использовать autohotkey, и я хотел создать скрипт, который открывает игру из Steam и автоматически подключается к определенному серверу. Мой код до сих пор: F1:: Run, steam://rungameid/346110 Sleep, 15000 <--- This is more or less the time that my computer takes to load it, and I want another …

cpu autohotkey gaming ocr steam

1

Как извлечь текст из PDF-файла на основе изображений с помощью Cuneiform в терминале

клинопись -l рус -f текст -o outocr.txt input.pdf Приведенная выше команда при запуске в терминале выводит только текст моей титульной страницы PDF в файл outocr.txt. Что я должен сделать, чтобы он распознал весь текст в 120-страничном PDF? Я использую Fedora Linux 25 (x86_64).

linux pdf fedora ocr

Вопросы с тегом «ocr»