Я хочу получить все файлы для данного сайта на archive.org. Причины могут включать в себя:
- оригинальный автор не заархивировал свой собственный сайт и теперь он не в сети, я хочу сделать из него публичный кеш
- Я оригинальный автор какого-то сайта и потерял часть контента. Я хочу восстановить это
- ...
Как мне это сделать ?
Принимая во внимание тот факт, что машина обратной передачи archive.org является очень особенной: ссылки на веб-страницы указывают не на сам архив, а на веб-страницу, которая может отсутствовать. JavaScript используется на стороне клиента для обновления ссылок, но такой трюк, как рекурсивный wget, не сработает.
gem install wayback_machine_downloader
. Запустите wayback_machine_downloader, указав в качестве параметра базовый URL-адрес веб-сайта, который вы хотите получить:wayback_machine_downloader http://example.com
Дополнительная информация: github.com/hartator/wayback_machine_downloader