Как получить скриншот лучшего качества для оптического распознавания символов?


2

Я пытаюсь получить некоторые данные в текстовый файл из скриншотов. Очевидно, что снимки экрана не очень хорошо работают с OCR, потому что они имеют разрешение 75 точек на дюйм, а минимальное значение для хорошего качества распознавания составляет 150 точек на дюйм. Кто-нибудь знает хороший способ сделать скриншоты для OCR?

Прямо сейчас я получаю довольно хорошие результаты с бесплатными онлайн-инструментами, такими как new-ocr, но он допускает ошибки, которые мне приходится время от времени исправлять. Так что я хотел бы несколько советов. Я также протестировал скриншот ABBYY, и это было довольно плохо ... онлайн-инструменты лучше.


Я использую программу чтения скриншотов ABBYY, и она отлично работает для меня. Я только что проверил это снова на ваш собственный вопрос. Интересно, если ваши задачи особенно сложны по какой-то причине?
texnic

Ответы:


1

С 21 июня 2011 года вы можете использовать Google Docs для скриншотов OCR в пакете.

Вы можете загрузить папку с изображениями и преобразовать их в документы, которые будут содержать как изображение, так и текст OCRed.

Затем вы можете пакетно загрузить все эти документы в виде обычного текста, который вычеркнет изображение.

Если ваши скриншоты имеют уникальные имена файлов, связать их с текстом OCRed должно быть тривиально практически в любой системе.


4

У меня недавно была похожая потребность (не для скриншота, а для страницы по факсу). Ocrterminal.com отлично поработал, он бесплатный и быстрый для определенного количества конверсий в месяц (я думаю, 20?). Друг использует Tesseract , который основан на командной строке и, кажется, также работает нормально.


Я использовал newocr.com, который также быстрый и бесплатный. Это сработало хорошо, но я исправил множество ошибок. О, хорошо, я не могу быть жадным, дело в том, чтобы делать фотографии и превращать их в текст, хе-хе ...
GiH


0

Я бы предположил, что, поскольку на снимках экрана используется шрифт вместо рукописного ввода с разрешением 75 точек на дюйм, это не так уж плохо.


Вы будете иногда удивлены, это не соответствует вообще
GiH

0

Я использую GreenShot для экранных крышек


1
говорить об OCR ...
GiH

Да, я не был уверен, так как вторая часть вопроса была немного двусмысленной;) Спасибо за обновление, чтобы уточнить.
Шевек
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.