Открытый исходный код предпочтителен, но не обязателен.
У меня есть Adobe Acrobat 8, и мне действительно нравится функция оптического распознавания текста, которая может по существу поместить невидимый слой текста оптического распознавания текста поверх отсканированного документа. Таким образом, то, что вы видите на экране, является оригинальным отсканированным документом, но результат доступен для поиска.
То, что я ищу, - это способ автоматизации этого процесса. В настоящее время у меня есть несколько сценариев, которые мы используем для обработки и архивирования отсканированных файлов, и я ищу что-то, что можно подключить прямо к этому пакетному процессу, чтобы сделать OCR способом, аналогичным тому, что я могу сделать с Acrobat.
Все предложения приветствуются, спасибо!