Переименование файла PDF в соответствии с метаданными?

9

Могу ли я использовать что-то, что переименовывает PDF-файлы в соответствии с их содержанием? По сути, это эквивалент http://macscripter.net/viewtopic.php?id=27620 в Ubuntu.

pdf document

— user13107
источник

4

Если вы знакомы с Python, вы можете использовать скрипт на http://blog.matt-swain.com/post/25650072381/a-lightweight-xmp-parser-for-extracting-pdf-metadata-in . Я только что проверил сценарии, которые он предоставляет (для начала, вы можете pip install pdfminer), и они прекрасно работают. Результат, который они дают, является чем-то вроде:

[{'ModDate': "D:20050422142709+02'00'", 'CreationDate': "D:20050422142709+02'00'", 'Producer': 'Mac OS X 10.3.8 Quartz PDFContext', 'Creator': 'Word'}]

Этот вывод вы можете использовать для переименования ваших файлов.

— don.joey
источник

1

До сих пор я предполагал, что вы имеете в виду метаданные с контентом (на основе вашей ссылки). Существует также хороший инструмент для поиска академической информации. Это называется pdfmeat .

— don.joey

5

Этого очень легко добиться с помощью exiftool .

Например, следующая команда переименует все файлы в текущем каталоге в <title>.extension:

exiftool '-filename<$title.%e' .

Вы можете установить exiftool в Ubuntu с помощью:

sudo apt-get install libimage-exiftool-perl

Пожалуйста, обратитесь к официальной документации для получения дополнительной информации:

http://www.sno.phy.queensu.ca/~phil/exiftool/filename.html

— Glutanimate
источник

3

Есть другая альтернатива. Вы могли бы sudo apt-get install pdftk. С этой библиотекой вы можете запустить команду, pdftk myfile.pdf dump_dataкоторая приводит к чему-то в виде набора infoи value:

InfoKey: Creator
InfoValue: Word
InfoKey: Producer
InfoValue: Mac OS X 10.3.8 Quartz PDFContext
InfoKey: ModDate
InfoValue: D:20050422142709+02'00'
InfoKey: CreationDate
InfoValue: D:20050422142709+02'00'
PdfID0: d7af25c8df737276d8d6b5de49d94d92
PdfID1: d7af25c8df737276d8d6b5de49d94d92
NumberOfPages: 58

Опять же, вы можете использовать эту информацию в сценарии переименования. Если вы чувствуете, что последнее лучше всего настроить, потому что это зависит от того, хотите ли вы просто заголовок, title-author или что-то еще.

Источник

— don.joey
источник

0

Если вы ищете нестандартное решение и ваши PDF-файлы носят академический характер, вы можете попробовать Zotero , плагин Firefox.

К сожалению, для этого требуется несколько шагов, каждый из которых может быть немного медленным, если вы пытаетесь работать с большим количеством PDF-файлов одновременно:

Перетащите PDF-файлы в Zotero.
Щелкните правой кнопкой мыши по ним, чтобы получить метаданные (и автоматически загрузить библиографическую информацию).
Если файлы были распознаны правильно, снова щелкните их правой кнопкой мыши, чтобы автоматически переименовать.
Экспорт или прямое перемещение переименованных файлов туда, куда вы хотите.

Ответ на аналогичный вопрос о суперпользователях показывает, как сделать то же самое с помощью Mendeley . В Zotero этот процесс может быть дополнительно автоматизирован с помощью Zotfile . Наконец, вот обширный список потенциально полезных инструментов в этом направлении.

— Брайан З
источник

0

Если вы ищете решение с графическим интерфейсом, KRename - очень мощный инструмент переименования, способный удовлетворить ваши требования.

установить:

sudo apt install krename

— Бруни
источник