Как я могу grep для строки рекурсивно через все .gzфайлы во всех каталогах и подкаталогах?
Как я могу grep для строки рекурсивно через все .gzфайлы во всех каталогах и подкаталогах?
Ответы:
@ Steve Weet почти там. Использование / dev / null в качестве дополнительного аргумента является хорошим способом заставить имя файла отображаться (я буду помнить это, спасибо Стиву), но он все равно запускает exec для каждого найденного файла - огромные накладные расходы.
Вы хотите запускать zgrep как можно меньше раз, получая максимальную отдачу от каждого выполнения:
find . -iname '*.gz' -print0 | xargs -0 zgrep PATTERN
xargsпредоставит zgrep столько аргументов (имен файлов), сколько возможно, и будет выполнять его несколько раз, пока не будут использованы все файлы, предоставленные findкомандой. Использование параметров -print0и -0позволяет работать, если в именах файлов или каталогов есть пробелы.
В Mac OS X вы можете добиться того же эффекта без xargs:
find . -iname '*.gz' -exec zgrep PATTERN {} +
-Hчтобы всегда показывать имя файла с соответствующей строкой, по крайней мере, в GNU grep.
$ zgrep --help
Usage: /bin/zgrep [OPTION]... [-e] PATTERN [FILE]...
Look for instances of PATTERN in the input FILEs, using their
uncompressed contents if they are compressed.
Так что-то вроде
find . -iname "*.gz" -exec zgrep PATTERN {} \
zgrep -rчтобы пройти по дереву, или, если -r не работает, перенаправить вывод поиска черезxargs zgrep
/bin/zgrep: -r: option not supportedвхожу в мою недавно установленную систему Ubuntu.
xargsвместо этого тогда.
@aioobe почти там. Команда выполнит работу, но не сообщит вам имя файла
Следующее должно также сказать вам имя файла:
find . -iname "*.gz" -exec zgrep PATTERN {} /dev/null \;
Добавление /dev/nullгарантирует, что zgrep видит два имени файла, поэтому он покажет вам имя файла, если найдет строку
РЕДАКТИРОВАТЬ
Дальнейшие исследования показывают, что для моей машины (OS / X) -execаргумент для поиска добавит столько имен файлов, сколько возможно (аналогично тому, как xargsведет себя).
-exec- я все о переносимости, поэтому я бы не использовал его в скрипте, но отлично подходит для командной строки.
find, но к большинству современных (например, в дистрибутивах на основе Debian).
-Hчтобы всегда показывать имя файла с соответствующей строкой, по крайней мере, в GNU grep, вместо /dev/nullвзлома.