8
Найти дубликаты файлов PDF по содержанию
Некоторые журналы генерируют разные PDF для каждой загрузки. APS, например, хранит время и IP-адрес в PDF. Или есть бумажная версия с гиперссылками и одна с текстовыми ссылками. Как можно найти повторяющиеся загрузки документов с равным содержанием на 90% в системе Linux с помощью программного обеспечения с открытым исходным кодом? Я …