Я не уверен, что true rsync подходит для Amazon.
Насколько я понимаю, стандартный алгоритм rsync означает, что клиент вычисляет хэши для каждого блока файла, а сервер вычисляет хэши для своей копии и отправляет эти хэши клиенту, что означает, что клиент может определить, какие блоки были изменены и нуждаются в загрузке.
Это создает две проблемы для Amazon в том, что многие хэши должны отправляться через Интернет, а также требуется вычислительная мощность для вычисления всех тех хешей, которые могут увеличить расходы Amazon - возможно, поэтому они оставляют это сторонним поставщикам, которые могут взимать дополнительную плату за эту функцию.
Что касается клонов, они, очевидно, хранят хэши где-то, и где-то может варьироваться в зависимости от клона. Они могут хранить хэши как отдельный объект для каждого файла в Amazon или как базу данных, хранящуюся в Amazon, или они могут хранить их локально и удаленно.
Есть преимущества и недостатки в том или ином случае. Если хеши хранятся удаленно в отдельных файлах, то их постоянное получение может быть дорогостоящим. Если хеши хранятся в базе данных удаленно, эта база данных может стать большой, и может быть дорогостоящим их постоянное получение и обновление. Если хеши хранятся локально, это помогает сократить расходы, но создает другие сложности и проблемы.
(Конечно, у Amazon есть другие сервисы, поэтому можно было бы хранить базу данных в Amazon DB)
Как пример, я попробовал один ранний клон rsync много лет назад. Это было написано не для того, чтобы принять во внимание структуру ценообразования Amazon, и он выдавал большое количество http-запросов для извлечения хэша каждого блока, и, поскольку Amazon взимал плату за каждое получение, это означало, что хотя часть моего счета на хранение резко упала, часть переноса раздулся.
Что я потеряю, используя duplicity + s3 вместо rsync + s3rsync + s3?
Вы теряете тот факт, что с rsync вы знаете, что сравниваете исходные файлы с файлами резервных копий. С двуличностью и другими клонами вы сравниваете ваши исходные файлы с хешем, который был взят при выполнении резервного копирования. Например, может быть возможен прямой доступ к S3 и замена одного из его файлов без повторного вычисления хэша или обновления базы данных хэша.