Wget перезаписывает файлы при зеркалировании многоязычного сайта


1

Я хотел бы отразить сайт с помощью wget. Проблема в том, что на сайте есть несколько языковых мутаций, которые переключаются с помощью параметра строки запроса, и когда wget начинает загружать версию на другом языке, она забивает предыдущую. Например, он начинается с index.html, захватывает часть сайта, затем обнаруживает ссылку на index.html? Lang = foo, начинает загрузку нового варианта языка и перезаписывает предыдущий index.html новым. Что я могу сделать, когда я хочу их всех?

Ответы:


1

Поскольку страницы на самом деле одинаковы, я не слишком уверен ...

Вы можете попробовать HTTrack, который является очень гибким копиром веб-сайта, и вы можете настроить правила, такие как исключение путей / страниц с определенной строкой запроса ... Или он может на самом деле иметь возможность загружать все языки, я не уверен на 100%, так как у меня есть не столкнуться с этой проблемой.


Это помогло, спасибо. Похоже, я смогу скачать сайт по одному языку за раз и исключить ссылки, которые ведут на другой.
zoul
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.