Как лучше всего определить углы накладной / чека / листа бумаги на фотографии? Это должно использоваться для последующей коррекции перспективы перед OCR.
Мой нынешний подход был:
RGB> Серый> Обнаружение Canny Edge с установлением порога> Расширить (1)> Удалить мелкие объекты (6)> очистить объекты границы> выбрать большой блог на основе Convex Area. > [определение угла - не реализовано]
Я не могу не думать, что должен быть более надежный «интеллектуальный» / статистический подход для обработки этого типа сегментации. У меня не так много обучающих примеров, но я, вероятно, смог бы собрать вместе 100 изображений.
Более широкий контекст:
Я использую Matlab для создания прототипа и планирую реализовать систему в OpenCV и Tesserect-OCR. Это первая из ряда проблем обработки изображений, которые мне нужно решить для этого конкретного приложения. Итак, я собираюсь развернуть собственное решение и заново ознакомиться с алгоритмами обработки изображений.
Вот пример изображения, которое я бы хотел обработать с помощью алгоритма: Если вы хотите принять вызов, большие изображения находятся на http://madteckhead.com/tmp
(источник: madteckhead.com )
(источник: madteckhead.com )
(источник: madteckhead.com )
(источник: madteckhead.com )
В лучшем случае это дает:
(источник: madteckhead.com )
(источник: madteckhead.com )
(источник: madteckhead.com )
Однако он легко терпит неудачу в других случаях:
(источник: madteckhead.com )
(источник: madteckhead.com )
(источник: madteckhead.com )
Заранее спасибо за все отличные идеи! Я так люблю!
РЕДАКТИРОВАТЬ: прогресс преобразования Хафа
В: Какой алгоритм будет кластеризовать горизонтальные линии для поиска углов? Следуя советам из ответов, я смог использовать преобразование Хафа, выбрать линии и отфильтровать их. Мой нынешний подход довольно груб. Я сделал предположение, что счет-фактура всегда будет меньше 15 градусов от выравнивания с изображением. Я получаю разумные результаты для строк, если это так (см. Ниже). Но я не совсем уверен в подходящем алгоритме для кластеризации линий (или голосования) для экстраполяции углов. Линии Хафа не непрерывны. А на зашумленных изображениях могут быть параллельные линии, поэтому требуются метрики какой-либо формы или расстояния от начала линии. Любые идеи?
(источник: madteckhead.com )