Как извлечь аннотации из файлов PDF?


11

Существует ли инструмент командной строки для извлечения аннотаций (комментарии добавлены с использованием evince) из PDF-файлов?

Я ищу такое решение, чтобы отправить людям отзыв о представленных документах. Помимо ответа с аннотированным PDF в качестве вложения, я хочу включить дамп моих комментариев в качестве замены для правильного журнала изменений в теле письма.

В manстраницах инструментов нравится pdftotext, pdftohtmlили pdfinfoя не нашел каких - либо полезных опций.


Пояснение: я не говорю о комментариях от руки (цифровыми чернилами).
Fheub

1
См. Сценарий python в ответе на этот вопрос stackoverflow.com/questions/1106098/…
mlberlin

@mlberlin спасибо за полезную ссылку! Я не понимаю, почему я не мог найти это сам тогда - но это действительно было очень давно…
Fheub

Ответы:


2

Да; видеть

/programming/1106098/parse-annotations-from-a-pdf

и возможно

https://github.com/measuresforjustice/textricator

(думал, что мы должны вынести этот вопрос из очереди unanswerd)


Может ли textricator также обрабатывать аннотации / комментарии из PDF-документов? Примеры и README описывают только обработку «обычного» контента.
Fheub
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.