Пересматривая это снова и пытаясь использовать ничего, кроме оболочки Bash, еще одно однострочное решение:
while read url; do url="${url##*/}" && echo "${url%%\'*}"; done < file.in > file.out
Где file.in содержит «грязный» список URL, а file.out будет содержать «чистый» список URL. Внешних зависимостей нет, и нет необходимости создавать новые процессы или подоболочки. Далее следует оригинальное объяснение и более гибкий сценарий. Существует хорошее описание способа здесь , смотри пример 10-10. Это шаблонная подстановка параметров в Bash.
Развивая идею:
src="define('URL', 'http://url.com');"
src="${src##*/}" # remove the longest string before and including /
echo "${src%%\'*}" # remove the longest string after and including '
Результат:
url.com
Не нужно вызывать какие-либо внешние программы. Кроме того, следующий скрипт bash get_urls.sh
позволяет вам читать файл напрямую или из stdin:
#!/usr/bin/env bash
# usage:
# ./get_urls.sh 'file.in'
# grep 'URL' 'file.in' | ./get_urls.sh
# assumptions:
# there is not more than one url per line of text.
# the url of interest is a simple one.
# begin get_urls.sh
# get_url 'string'
function get_url(){
local src="$1"
src="${src##*/}" # remove the longest string before and including /
echo "${src%%\'*}" # remove the longest string after and including '
}
# read each line.
while read line
do
echo "$(get_url "$line")"
done < "${1:-/proc/${$}/fd/0}"
# end get_urls.sh
cat file.php | grep 'URL' | cut -d "'" -f 4
.