В Bash как подсчитать количество непустых строк кода в проекте?
sloc
и cloc
они здесь для подсчета количества строк кода.
В Bash как подсчитать количество непустых строк кода в проекте?
sloc
и cloc
они здесь для подсчета количества строк кода.
Ответы:
cat foo.c | sed '/^\s*$/d' | wc -l
И если вы считаете комментарии пустыми строками:
cat foo.pl | sed '/^\s*#/d;/^\s*$/d' | wc -l
Хотя это зависит от языка.
< foo.pl sed 'stuff' | wc -l
.
#!/bin/bash
find . -path './pma' -prune -o -path './blog' -prune -o -path './punbb' -prune -o -path './js/3rdparty' -prune -o -print | egrep '\.php|\.as|\.sql|\.css|\.js' | grep -v '\.svn' | xargs cat | sed '/^\s*$/d' | wc -l
Выше приведено общее количество строк кода (пустые строки удалены) для проекта (текущая папка и все подпапки рекурсивно).
В приведенных выше "./blog" "./punbb" "./js/3rdparty" и "./pma" находятся папки, которые я в черном списке, так как я не написал в них код. Также .php, .as, .sql, .css, .js являются расширениями просматриваемых файлов. Любые файлы с другим расширением игнорируются.
$
в grep ( ...\.js$|...
), иначе он будет совпадать feature.js.swp
.
find . | egrep '.\.c$|.\.h$' | xargs cat | sed '/^\s*$/d' | wc -l
Если вы хотите использовать что-то кроме сценария оболочки, попробуйте CLOC :
cloc считает пустые строки, строки комментариев и физические строки исходного кода во многих языках программирования. Он полностью написан на Perl без каких-либо зависимостей вне стандартного дистрибутива Perl v5.6 и выше (код из некоторых внешних модулей встроен в cloc) и поэтому довольно переносим.
Есть много способов сделать это, используя обычные утилиты оболочки.
Мое решение:
grep -cve '^\s*$' <file>
При этом выполняется поиск строк в <file> не совпадающих (-v) строках, которые соответствуют шаблону (-e) '^ \ s * $', который является началом строки, за которой следуют 0 или более пробельных символов, а затем к концу строки (т. е. нет содержимого, отличного от пробела), и отобразите количество совпадающих строк (-c) вместо самих совпадающих строк.
Преимущество этого метода перед методами, которые включают в себя конвейерную передачу wc
, состоит в том, что вы можете указать несколько файлов и получить отдельный счетчик для каждого файла:
$ grep -cve '^\s*$' *.hh
config.hh:36
exceptions.hh:48
layer.hh:52
main.hh:39
-e
не обязательно. Это нормальное позиционное расположение паттерна, и вы не делаете с ним ничего прикольного. Но нет ничего плохого в том, чтобы быть явным, если это твой стиль.
'wc' считает строки, слова, символы, поэтому для подсчета всех строк (включая пустые) используйте:
wc *.py
Чтобы отфильтровать пустые строки, вы можете использовать grep:
grep -v '^\s*$' *.py | wc
«-v» указывает grep выводить все строки, кроме тех, которые соответствуют «^» - начало строки. «\ s *» - ноль или более пробельных символов. «$» - конец строки * .py - мой пример для все файлы, которые вы хотите посчитать (все файлы Python в текущем каталоге), выводятся в канал wc. Пошли.
Я отвечаю на свой (настоящий) вопрос. Не удалось найти запись переполнения стека, покрывающую это.
Эта команда подсчитывает количество непустых строк. cat fileName | grep -v ^$ | wc -l
grep -v ^ $ функция регулярного выражения игнорирует пустые строки.
cat
этой цепочке нет необходимости :grep -v ^$ fileName | wl -l
wc -l
потому что у grep -c
:grep -vc ^$ fileName
cat 'filename' | grep '[^ ]' | wc -l
должен сделать трюк просто отлично
awk '/^[[:space:]]*$/ {++x} END {print x}' "$testfile"
awk '!/^[[:space:]]*$/{++x} END{print x}'
. Или, если вы действительно ненавидите негативы awk '{y++} /^[[:space:]]*$/{++x} END{print y-x}'
grep -cvE '(^\s*[/*])|(^\s*$)' foo
-c = count
-v = exclude
-E = extended regex
'(comment lines) OR (empty lines)'
where
^ = beginning of the line
\s = whitespace
* = any number of previous characters or none
[/*] = either / or *
| = OR
$ = end of the line
Я отправляю это, потому что другие варианты дали неправильные ответы для меня. Это работало с моим источником Java, где строки комментариев начинаются с / или * (я использую * в каждой строке в многострочном комментарии).
Вот скрипт Bash, который считает строки кода в проекте. Он рекурсивно просматривает исходное дерево и исключает пустые строки и однострочные комментарии, которые используют «//».
# $excluded is a regex for paths to exclude from line counting
excluded="spec\|node_modules\|README\|lib\|docs\|csv\|XLS\|json\|png"
countLines(){
# $total is the total lines of code counted
total=0
# -mindepth exclues the current directory (".")
for file in `find . -mindepth 1 -name "*.*" |grep -v "$excluded"`; do
# First sed: only count lines of code that are not commented with //
# Second sed: don't count blank lines
# $numLines is the lines of code
numLines=`cat $file | sed '/\/\//d' | sed '/^\s*$/d' | wc -l`
# To exclude only blank lines and count comment lines, uncomment this:
#numLines=`cat $file | sed '/^\s*$/d' | wc -l`
total=$(($total + $numLines))
echo " " $numLines $file
done
echo " " $total in total
}
echo Source code files:
countLines
echo Unit tests:
cd spec
countLines
Вот как выглядит вывод для моего проекта :
Source code files:
2 ./buildDocs.sh
24 ./countLines.sh
15 ./css/dashboard.css
53 ./data/un_population/provenance/preprocess.js
19 ./index.html
5 ./server/server.js
2 ./server/startServer.sh
24 ./SpecRunner.html
34 ./src/computeLayout.js
60 ./src/configDiff.js
18 ./src/dashboardMirror.js
37 ./src/dashboardScaffold.js
14 ./src/data.js
68 ./src/dummyVis.js
27 ./src/layout.js
28 ./src/links.js
5 ./src/main.js
52 ./src/processActions.js
86 ./src/timeline.js
73 ./src/udc.js
18 ./src/wire.js
664 in total
Unit tests:
230 ./ComputeLayoutSpec.js
134 ./ConfigDiffSpec.js
134 ./ProcessActionsSpec.js
84 ./UDCSpec.js
149 ./WireSpec.js
731 in total
Наслаждайтесь! - Курран
Это будет зависеть от количества файлов в вашем проекте. В теории вы могли бы использовать
grep -c '.' <list of files>
Где вы можете заполнить список файлов с помощью утилиты поиска.
grep -c '.' `find -type f`
Даст вам количество строк на файл.
Скрипт для рекурсивного подсчета всех непустых строк с определенным расширением файла в текущем каталоге:
#!/usr/bin/env bash
(
echo 0;
for ext in "$@"; do
for i in $(find . -name "*$ext"); do
sed '/^\s*$/d' $i | wc -l ## skip blank lines
#cat $i | wc -l; ## count all lines
echo +;
done
done
echo p q;
) | dc;
Пример использования:
./countlines.sh .py .java .html
Если вы хотите получить сумму всех непустых строк для всех файлов с заданным расширением во всем проекте:
while read line
do grep -cve '^\s*$' "$line"
done < <(find $1 -name "*.$2" -print) | awk '{s+=$1} END {print s}'
Первый аргумент - это базовый каталог проекта, второй - расширение файла. Пример использования:
./scriptname ~/Dropbox/project/src java
Это немного больше, чем коллекция предыдущих решений.
grep -v '^\W*$' `find -type f` | grep -c '.' > /path/to/lineCountFile.txt
дает общее количество для всех файлов в текущем каталоге и его подкаталогах.
НТН!
${-[*]} + $@
, например. Который, безусловно, действительный код где-то в мире. ;) Вы имеете в виду \ s для космоса.
rgrep . | wc -l
дает количество непустых строк в текущем рабочем каталоге.
Для этого в Linux уже есть программа под названием 'wc'.
Просто
wc -l *.c
и это дает вам общее количество строк и строк для каждого файла.
wc
считает пустые строки. ОП хочет подсчитать непустые строки. Это правда, что он захочет использоватьwc
, но только после того, как он будет отредактирован потоком с помощьюsed
foo.c
). Любые мысли о количестве строк в проекте (например, много файлов в структуре каталогов, и исключая двоичные файлы)?