2
Как избежать искажения результатов с помощью инструмента OCR pdfsandwich?
Обычно отсканированные страницы должны быть выровнены до применения инструмента OCR. Здесь мой вход - это страница с прямым сканированием, а выходной сигнал OCR иногда искажается, по часовой стрелке или против часовой стрелки. В моем случае использования английской книги на 260 страниц это происходит на 14 страницах. Пример: input.pdf: output.pdf Команда: …