Есть ли способ конвертировать zip
архив в tar
архив без предварительного извлечения во временный каталог? (и без написания моей собственной реализации tar
или unzip
)
Есть ли способ конвертировать zip
архив в tar
архив без предварительного извлечения во временный каталог? (и без написания моей собственной реализации tar
или unzip
)
Ответы:
Теперь это доступно как устанавливаемая команда из PyPI, см. Конец этого поста.
Я не знаю ни одной «стандартной» утилиты, которая бы это делала, но когда мне понадобилась эта функциональность, я написал следующий скрипт на Python для перехода от ZIP к сжатым архивам tar Bzip2 без предварительного извлечения чего-либо на диск:
#! /usr/bin/env python
"""zip2tar """
import sys
import os
from zipfile import ZipFile
import tarfile
import time
def main(ifn, ofn):
with ZipFile(ifn) as zipf:
with tarfile.open(ofn, 'w:bz2') as tarf:
for zip_info in zipf.infolist():
#print zip_info.filename, zip_info.file_size
tar_info = tarfile.TarInfo(name=zip_info.filename)
tar_info.size = zip_info.file_size
tar_info.mtime = time.mktime(list(zip_info.date_time) +
[-1, -1, -1])
tarf.addfile(
tarinfo=tar_info,
fileobj=zipf.open(zip_info.filename)
)
input_file_name = sys.argv[1]
output_file_name = os.path.splitext(input_file_name)[0] + '.tar.bz2'
main(input_file_name, output_file_name)
Просто сохраните его zip2tar
и сделайте его исполняемым или сохраните его zip2tar.py
и запустите python zip2tar.py
. Укажите имя файла ZIP в качестве аргумента сценария. Выходное имя файла xyz.zip
будетxyz.tar.bz2
.
Сжатый вывод Bzip2 обычно намного меньше, чем файл zip, поскольку последний не использует шаблоны сжатия для нескольких файлов, но также меньше шансов восстановить более поздний файл, если что-то в файле Bzip2 неверно.
Если вы не хотите сжатие вывода, удалите :bz2
и .bz2
из кода.
Если вы pip
установили в среде Python3, вы можете сделать:
pip3 install ruamel.zip2tar
чтобы получить zip2tar
утилиту командной строки, делающую вышеуказанное (отказ от ответственности: я являюсь автором этого пакета).
time
не хватает import
.
time
комментарий, я обновляю ответ
Команда tar
имеет дело с файловыми системами. Входные данные представляют собой список файлов, которые затем считываются из файловой системы (включая большое количество метаданных). Вам нужно будет представить zip-файл как файловую систему для tar
команды, чтобы прочитать его.
Виртуальная файловая система - AVFS позволяет любой программе просматривать архивные или сжатые файлы через стандартный интерфейс файловой системы через FUSE .
В файле readme для avfs-fuse есть некоторая подробная информация, и в некоторых дистрибутивах есть пакеты для этого.
Один у вас установлен AVFS, то вы можете
mountavfs
cd ~/.avfs/path/to/somefile.zip#
tar -cvf /path/whatever.tar .
AVFS заполнит любую информацию для файловой системы, которая отсутствует в zip-файле, например, о принадлежности файла, которую подберет tar.
Вот небольшой фрагмент, который преобразует ZIP-архив в соответствующий архив TAR.GZ OnTheFly.
Конвертировать ZIP архив в TAR архив на лету
# File: zip2tar.py
#
# Convert ZIP archive to TAR.GZ archive.
#
# Written by Fredrik Lundh, March 2005.
# helpers (tweak as necessary)
def getuser():
# return user name and user id
return "anonymous", 1000
def getmode(name, data):
# return mode ("b" or "t") for the given file.
# you can do this either by inspecting the name, or
# the actual data (e.g. by looking for non-ascii, non-
# line-feed data).
return "t" # assume everything's text, for now
#
# main
import tarfile
import zipfile
import glob, os, StringIO, sys, time
now = time.time()
user = getuser()
def fixup(infile):
file, ext = os.path.splitext(infile)
outfile = file + ".tar.gz"
dirname = os.path.basename(file)
print outfile
zip = zipfile.ZipFile(infile, "r")
tar = tarfile.open(outfile, "w:gz")
tar.posix = 1
for name in zip.namelist():
if name.endswith("/"):
continue
data = zip.read(name)
if getmode(name, data) == "t":
data = data.replace("\r\n", "\n")
tarinfo = tarfile.TarInfo()
tarinfo.name = name
tarinfo.size = len(data)
tarinfo.mtime = now
tarinfo.uname = tarinfo.gname = user[0]
tarinfo.uid = tarinfo.gid = user[1]
tar.addfile(tarinfo, StringIO.StringIO(data))
tar.close()
zip.close()
# convert all ZIP files in the current directory
for file in glob.glob("*.zip"):
fixup(file)