У меня проблема с запуском движка tesseract-ocr на Linux. Я скачал данные для русского языка и поместил их в каталог tessdata (/ usr / local / share / tessdata). Когда я пытаюсь запустить tesseract с помощью команды tesseract blob.jpg out -l rus
, отображается ошибка:
Error opening data file /usr/local/share/tessdata/eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language eng
Tesseract couldn't load any languages!
Could not initialize tesseract.
Согласно руководству по компиляции , я использовалexport TESSDATA_PREFIX='/usr/local/share/'
указывал свой каталог tessdata. Может стоит отредактировать какие-нибудь файлы конфигурации? Tesseract пытается загрузить файлы данных eng вместо rus.
Скриншот: http://i.stack.imgur.com/I0Guc.png