В основном я ищу, чтобы увидеть, существует ли инструмент или сценарий, который может обнаружить перемещенные или переименованные файлы, чтобы я мог получить список переименованных / перемещенных файлов и применить ту же операцию на другом конце сети для экономии пропускной способности.
В основном дисковое хранилище дешевое, но пропускная способность - нет, и проблема в том, что файлы часто реорганизуются или перемещаются в лучшую структуру каталогов, поэтому при использовании rsync для резервного копирования rsync не заметит, что он переименован или переместить файл и заново передать его по сети, несмотря на наличие того же файла на другом конце.
Поэтому мне интересно, если существует сценарий или инструмент, который может записывать, где все файлы и их имена, то непосредственно перед резервным копированием он будет повторно сканировать и обнаруживать перемещенные или переименованные файлы, тогда я могу взять этот список и повторно применить операция перемещения / переименования на другой стороне.
Вот список «общих» возможностей файлов:
- Большие неизменяемые файлы
- Они могут быть переименованы или перемещены
[Edit:] Это все хорошие ответы, и в итоге я посмотрел на все ответы и напишу некоторый код для решения этой проблемы. В основном, я думаю / работаю сейчас:
- Использование чего-то вроде AIDE для «начального» сканирования и позволяет мне сохранять контрольные суммы для файлов, потому что они, как предполагается, никогда не меняются, так что это поможет при обнаружении повреждений.
- Создание демона inotify, который будет отслеживать эти файлы / каталог и записывать любые изменения, связанные с переименованием и перемещением файлов в файл журнала.
- Есть некоторые крайние случаи, когда inotify может не записать, что что-то случилось с файловой системой, поэтому существует последний шаг использования find для поиска в файловой системе файлов, у которых есть время изменения, более позднее чем последняя резервная копия .
Это имеет несколько преимуществ:
- Контрольные суммы / и т.д. от AIDE, чтобы иметь возможность проверить / убедиться, что некоторые носители не были повреждены
- Inotify поддерживает низкое использование ресурсов и не требует повторного сканирования файловой системы снова и снова.
- Нет необходимости исправлять Rsync; Если мне нужно исправлять то, что я могу, но я бы предпочел избегать исправлений, чтобы снизить нагрузку (IE не нужно обновлять каждый раз, когда происходит обновление).
- Я использовал Unison и раньше, и это здорово, но я мог бы поклясться, что Unison хранит копии в файловой системе и что его «архивные» файлы могут вырасти до довольно больших?