Я спустился в кроличью нору после того, как другие ответы меня не устроили, и мне удалось выяснить, что моя версия tar (1.27.1 из репозитория openSUSE 42.3 OSS) pax
по умолчанию использует недетерминированный архивный формат, что означает, что даже без сжатия (и даже без явной установки mtime) архивы, созданные с помощью tar из одних и тех же файлов, будут отличаться:
$ echo hi > test.file
$ tar --create --to-stdout test.file # long form of `tar cO test.file`
./PaxHeaders.13067/test.file0000644000000000000000000000013213427447703012603 xustar0030 mtime=1549684675.835011178
30 atime=1549684726.410510251
30 ctime=1549684675.835011178
test.file0000644000175000001440000000000313427447703013057 0ustar00hartusers00000000000000hi
$ tar --create --to-stdout test.file
./PaxHeaders.13096/test.file0000644000000000000000000000013213427447703012605 xustar0030 mtime=1549684675.835011178
30 atime=1549684726.410510251
30 ctime=1549684675.835011178
test.file0000644000175000001440000000000313427447703013057 0ustar00hartusers00000000000000hi
Обратите внимание, что вывод выше отличается, даже если сжатие не используется ; несжатое содержимое архива (созданное при запуске tar дважды для одного и того же содержимого) отличается, поэтому сжатое содержимое также будет отличаться даже при использовании, GZIP=-n
как предлагают другие ответы
Чтобы обойти это, вы можете указать --format gnu
:
$ tar --create --format gnu --to-stdout test.file
test.file0000644000175000001440000000000313427447703011557 0ustar hartusershi
$ tar --create --format gnu --to-stdout test.file
test.file0000644000175000001440000000000313427447703011557 0ustar hartusershi
Это работает с предложением о gzip выше:
# gzip refuses to write to stdout, so we'll use the `-f` option to create a file
$ GZIP=-n tar --format gnu -czf test.file.tgz test.file && md5sum test.file.tgz
0d8c7b3bdbe8066b516e3d3af60ade75 test.file.tgz
$ GZIP=-n tar --format gnu -czf test.file.tgz test.file && md5sum test.file.tgz
0d8c7b3bdbe8066b516e3d3af60ade75 test.file.tgz
# without GZIP=-n we see a different hash
$ tar --format gnu -czf test.file.tgz test.file && md5sum test.file.tgz
682ce0c8267b90f4103b4c29903c5a8d test.file.tgz
Однако, в дополнение к уважительным причинам, предпочитающим более эффективные форматы сжатия, чем gzip , вы можете рассмотреть возможность использования вместо него xz (который tar также поддерживает с флагами --xz
или -J
вместо -z
), потому что это экономит вам здесь шаг; поведение по умолчанию xz
- генерировать одинаковые сжатые выходные данные, когда несжатое содержимое одинаково, поэтому нет необходимости указывать такую опцию, как GZIP=-n
:
$ tar --format gnu --xz -cf test.file.txz test.file && md5sum test.file.txz
dea99037d4b0ee4565b3639e93ac0930 test.file.txz
$ tar --format gnu --xz -cf test.file.txz test.file && md5sum test.file.txz
dea99037d4b0ee4565b3639e93ac0930 test.file.txz
touch filename
изменения времени изменения файла достаточно изменить контрольную сумму.