У меня есть большой и растущий набор текстовых файлов, которые все довольно малы (менее 100 байт). Я хочу различить каждую возможную пару файлов и отметить, которые являются дубликатами. Я мог бы написать скрипт Python для этого, но мне интересно, есть ли существующий инструмент командной строки Linux (или, возможно, простая комбинация инструментов), который бы делал это?
Обновление (в ответ на комментарий mfinni ): все файлы находятся в одном каталоге, поэтому все они имеют разные имена файлов. (Но у всех них есть общее расширение имени файла, что позволяет легко выбирать их все с помощью подстановочного знака.)