Недавно я наткнулся на Tesseract и OpenCV . Похоже, что Tesseract - это полноценный движок OCR, а OpenCV можно использовать в качестве основы для создания приложения / сервиса OCR.
Я пробовал использовать Tesseract на некоторых своих изображениях, и его точность кажется приличной. Позже я наткнулся на очень простой учебник по использованию OpenCV для OCR с использованием Python и был впечатлен. Через несколько минут я закончил обучение системы, и ее точность была хорошей. Но, конечно, такой подход означает, что мне нужно тщательно обучить мою систему, используя большой обучающий набор.
Мои конкретные вопросы следующие:
- Как выбрать между Tesseract и OpenCV для создания собственного приложения OCR?
- Для Tesseract доступны наборы обучающих данных для разных языков. Есть ли в OpenCV что-то подобное, чтобы мне не нужно было начинать с нуля, чтобы достичь OCR?
- Какой вариант лучше для коммерческого приложения?
Какие-либо предложения?