Итак, у меня есть этот дамп в Википедии размером около 10 ГБ и названный «enwiki-latest-pages-article.xml.bz2». Я пытался следующие команды в терминале, чтобы распаковать дамп:
tar jxf enwiki-latest-pages-articles.xml.bz2
А также
tar xvf enwiki-latest-pages-articles.xml.bz2
Но оба они возвращают следующую ошибку
tar: This does not look like a tar archive
tar: Skipping to next header
1
arun запускает следующую команду и выходит за пределы файла "enwiki-latest-pages-
—
article.xml.bz2
Этот Q / A может помочь, используйте
—
c0rp
7z
util для извлечения всего
Я заметил, что вы говорите, что это огромный файл - так что, возможно, вы захотите сделать что-то еще, например, bzcat enwiki-latest-pages-article.xml.bz2 | someotherprogram
—
nwaltham
@nwaltham: у тебя было бы мое возражение, если бы ты сделал это ответ.
—
Ильмари Каронен,
Поскольку tar извлекает файлы tar, а это не файл tar?
—
user253751