Если вы используете расширение скобок с помощью wget
, вы можете легко получать изображения с последовательными номерами:
$ wget 'http://www.iqandreas.com/sample-images/100-100-color/'{90..110}'.jpg'
Он извлекает первые 10 файлов , пронумерованных 90.jpg
в 99.jpg
только штраф, но 100.jpg
и далее возвращает 404: Файл не найдено ошибку ( у меня только 100 изображений , хранящихся на сервере). Эти несуществующие файлы становятся более «проблемой», если вы используете больший диапазон, например {00..200}
, при наличии 100 несуществующих файлов это увеличивает время выполнения скрипта и может даже стать небольшим бременем (или, по крайней мере, раздражением) для сервер.
Есть ли способ для wget
остановки после получения первой ошибки 404? (или даже лучше, два подряд, если в диапазоне отсутствовал файл по другой причине). В ответе не нужно использовать скобку; петли тоже хорошо.
1, 2 or even n failures
это не правильный путь, когда вы знаете[begin .. end]
индексы. Зачем вам указывать[1..200]
диапазон, если вы знаете, что в нем только 100 изображений[1..100]
? Я думаю, вы можете попробовать GNUparallel
для одновременных запросов, чтобы ускорить процесс.