Я хотел бы знать размер документов, размещенных на веб-сайте.
Решением может быть загрузка всего содержимого этого веб-сайта с помощью таких инструментов, как wget -r
. Тем не менее, этот конкретный веб-сайт содержит много огромных файлов, и объем данных, вероятно, превышает 3To. Я не могу позволить себе использовать такую пропускную способность и размещать так много данных.
Вторым решением может быть подключение по FTP по этому сайту. Но у меня нет доступа по FTP к этому серверу.
Есть ли другое решение моей проблемы? Подводя итог, я хочу знать, насколько большой каталог размещен на веб-сайте, и у меня есть только разрешения на чтение и просмотр.
PS: я использую Linux (Debian) и приветствую, в частности, каждое совместимое с ним решение.
HEAD
запросы и просматривать заголовок Content-Length в ответе, но не все веб-серверы содержат эту информацию, особенно для динамического контента. Вам также необходимо знать, какие именно URL запрашивать.