Как я могу найти дубликаты фотографий?


Ответы:


60

Digikam Установить через центр программного обеспечения

Добавьте все фотографии в вашу коллекцию. В меню выберите «Инструменты / Найти дубликаты». Это будет искать дубликаты по всей вашей коллекции.

findimagedupes Установить через центр программного обеспечения

Инструмент командной строки. Передайте все изображения, которые вы хотите сравнить, в командной строке.

Geeqie (ранее GQview )Установить через центр программного обеспечения

В меню выберите «Файл / Найти дубликат». Перетащите файлы изображений сделать окно дубликатов. Вы можете удалить каталоги, чтобы добавить их содержимое рекурсивно. Для визуального сравнения изображений в раскрывающемся меню есть определенные параметры, отличные от заданных по умолчанию. «Настраиваемый» уровень сходства позволяет ограничивать пары только наивысшей степенью сходства, но он должен быть установлен на «Предпочтения» равным 99. Даже тогда он не работает идеально, по крайней мере, для некоторых видов изображений, таких как линейные искусство. К сожалению, он не предоставляет механизм автоматического выбора с рациональными критериями, такими как разрешение, дата или что-то еще, автоматический выбор, кажется, просто случайным образом выбирает первое найденное изображение в качестве эталона для сохранения. Удаление многих изображений может быть очень медленным, так как он пытается обновить счетчик результатов при каждом удалении.


Все три из этих инструментов находят визуальные дубликаты, а не только файлы, идентичные байты за байтом.


7
Я обнаружил, что Geeqie работает лучше всего. Он имеет надежный набор режимов поиска (имя, контрольная сумма, размер и т. Д.), Мощное сканирование на сходство изображений, подробную информацию о найденных дубликатах, простой пользовательский интерфейс, и нет необходимости сначала добавлять изображения в коллекцию или альбом. Единственным моим минусом является то, что Duplicate Finder скрыт под меню «Файл», и вам нужно перетаскивать из Nautilus (или другого FM), чтобы добавить изображения / папки для поиска. Кроме этого он выполняет работу и делает это хорошо.
японская зона

2
Geeqie может найти похожие изображения, и это работает довольно хорошо, но я нашел это немного медленным для точных совпадений, и было утомительно удалять много дубликатов с ним.
Wernight

Другим выбором (который, кажется, работает довольно хорошо) является то, что этот инструмент также называется findimagedupes , но не связан с инструментом, размещенным на Sourceforge.
Винни

Digikam имеет удивительный интерфейс поиска дубликатов. Я очень рекомендую.
wbkang

22

FSlint Установить FSlint

fslintэто графическая программа, которая может найти дубликаты файлов любого типа по md5sum. Если изображения не идентичны, они не будут помечены как дубликаты. На изображении ниже показана куча дубликатов PDF-файлов в моем каталоге загрузок:

введите описание изображения здесь

Вы можете изменить параметры расширенного поиска для поиска по типу файла и ограничиться только изображениями. Это делается путем изменения «дополнительных параметров поиска» в качестве findпараметров команды. Например, здесь я только ищу *.jpgфайлы (по тому же пути, только смотря на мою папку «Загрузки»:

введите описание изображения здесь

fdupes Установить fdupes

fdupesявляется эквивалентным инструментом на основе командной строки. Оба доступны в репозиториях.


12
Обратите внимание, что я сомневаюсь, что эти программы найдут дубликаты измененного размера.
Вадим Перетокин

@ Вади это другой, более сложный вопрос. Tineye выполняет идентификацию изображений, которая не зависит от метаданных, хэшей и т. Д. (Он может идентифицировать похожие изображения), но это онлайн-сервис. Они предоставляют API, но я пока не знаю ни одного приложения, которое бы им воспользовалось. Другая сложность заключается в том, что вы не захотите все время удалять похожие изображения, например, если вы редактируете фотографии, но хотите сохранить копии оригиналов. Удаление идентичных дубликатов намного безопаснее.
Джон Лион

4
ОП явно заявляет «включая фотографии, размер которых был изменен», так что это не ответ.
Калимо

7

fdupes Установить fdupes

Вы можете использовать инструмент командной строки, который вызывается fdupesдля поиска дубликатов файлов ( man fdupesподробнее см.). Я не знаю ни одного способа найти «дубликаты», размеры которых были изменены. Программа, которая сделала это, потребовала бы своего рода интеллектуального алгоритма, который анализировал содержание изображения, потому что, когда изображение изменяется, его данные изменяются, поэтому традиционные методы поиска дубликатов не будут работать.


fdupes также пропустит дубликаты в разных каталогах; скажем, у вас есть две копии фотографии, одна в папке Birthday-party /, а другая в family-stuff / ... "fdupes -fr." пропустит этот дубликат.
lrkwz

2
fdupes не обрабатывает дубликаты, размер которых был изменен, и изменения метаданных.
Калимо

6

imgSeek Установите imgseek

imgSeek может найти дубликаты, а также похожие изображения (поэтому он должен иметь возможность находить фотографии и фотографии с измененными размерами с разными именами файлов и метаданными) и даже искать фотографии на основе эскиза. Он доступен в настольной и серверной версиях.

Я на самом деле не пробовал сам, хотя.


доступно только для Ubuntu 10.04, хотя есть библиотека perl для 12.04
drevicko

Версия сервера isk-daemonработает на 12.04, хотя я обнаружил, что мне пришлось установить из исходного кода ( pip installв соответствии со страницей установки не работает)
drevicko

4

dupeGuru Picture Edition работает абсолютно отлично, и стоит попробовать.

У них есть Launchpad PPA , dupeguru(новый пакет all-in-one) или dupeguru-pe(старый пакет редакции рисунков) можно установить из него с помощью следующих команд:

sudo add-apt-repository ppa:hsoft/ppa
sudo apt-get update
sudo apt-get install dupeguru

Похоже, у dupeGuru нет отдельных изданий. Это работает хорошо, хотя интерфейс мог бы быть лучше. Это также доступно в AUR, если вы используете Arch.
user31389 11.11.16

2

VisiPics

Visipics - это бесплатное приложение для Windows для этой функции, но оно прекрасно работает в Linux, конечно, через Wine (это лучше, чем geeqie / gqview в отношении сортировки дубликатов (результаты geeqie абсолютно «не сортируются»)).

Вы можете сказать ему, чтобы автоматически выбирать изображения на основе таких критериев, как меньший размер файла, несжатый тип, низкое разрешение (хотя это не будет наоборот, вам нужно будет сделать это вручную, что не будет гораздо лучше, чем делать это в Geeqie, за исключением того, что выделение не требует удержания Shift/ Ctrl) и даже приоритезации папок (но последний приоритет - приоритет папки).

Вы должны обратить внимание на символические ссылки, хотя - он может «случайным образом» выбрать, чтобы сохранить символическую ссылку на файл при удалении фактического файла в качестве «копии». Это позор.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.