ОБНОВЛЕНИЕ: я сделал все это ниже, что круто, но я придумал лучший способ сортировки каталогов по использованию inode:
du --inodes -S | sort -rh | sed -n \
'1,50{/^.\{71\}/s/^\(.\{30\}\).*\(.\{37\}\)$/\1...\2/;p}'
И если вы хотите остаться в той же файловой системе, вы делаете:
du --inodes -xS
Вот пример выходных данных:
15K /usr/share/man/man3
4.0K /usr/lib
3.6K /usr/bin
2.4K /usr/share/man/man1
1.9K /usr/share/fonts/75dpi
...
519 /usr/lib/python2.7/site-packages/bzrlib
516 /usr/include/KDE
498 /usr/include/qt/QtCore
487 /usr/lib/modules/3.13.6-2-MANJARO/build/include/config
484 /usr/src/linux-3.12.14-2-MANJARO/include/config
ТЕПЕРЬ С ЛС:
Несколько человек упомянули, что у них нет современных coreutils, и опция --inodes для них недоступна. Итак, вот ls:
sudo ls -AiR1U ./ |
sed -rn '/^[./]/{h;n;};G;
s|^ *([0-9][0-9]*)[^0-9][^/]*([~./].*):|\1:\2|p' |
sort -t : -uk1.1,1n |
cut -d: -f2 | sort -V |
uniq -c |sort -rn | head -n10
Это дает мне почти идентичные результаты для du
команды:
DU:
15K /usr/share/man/man3
4.0K /usr/lib
3.6K /usr/bin
2.4K /usr/share/man/man1
1.9K /usr/share/fonts/75dpi
1.9K /usr/share/fonts/100dpi
1.9K /usr/share/doc/arch-wiki-markdown
1.6K /usr/share/fonts/TTF
1.6K /usr/share/dolphin-emu/sys/GameSettings
1.6K /usr/share/doc/efl/html
LS:
14686 /usr/share/man/man3:
4322 /usr/lib:
3653 /usr/bin:
2457 /usr/share/man/man1:
1897 /usr/share/fonts/100dpi:
1897 /usr/share/fonts/75dpi:
1890 /usr/share/doc/arch-wiki-markdown:
1613 /usr/include:
1575 /usr/share/doc/efl/html:
1556 /usr/share/dolphin-emu/sys/GameSettings:
Я думаю include
, что все зависит от того, на какой каталог программа сначала смотрится - потому что они одинаковые и жестко связаны. Вроде как вещь выше. Хотя я могу ошибаться в этом - и я приветствую исправление ...
Основополагающий метод этого заключается в том, что я заменяю каждое из ls
имен файлов на содержащее его имя каталога в sed.
разделе «Далее» ... Ну, я сам немного нечеткий. Я вполне уверен, что он точно считает файлы, как вы можете видеть здесь:
% _ls_i ~/test
> 100 /home/mikeserv/test/realdir
> 2 /home/mikeserv/test
> 1 /home/mikeserv/test/linkdir
DU DEMO
% du --version
> du (GNU coreutils) 8.22
Создайте тестовый каталог:
% mkdir ~/test ; cd ~/test
% du --inodes -S
> 1 .
Некоторые детские каталоги:
% mkdir ./realdir ./linkdir
% du --inodes -S
> 1 ./realdir
> 1 ./linkdir
> 1 .
Сделайте несколько файлов:
% printf 'touch ./realdir/file%s\n' `seq 1 100` | . /dev/stdin
% du --inodes -S
> 101 ./realdir
> 1 ./linkdir
> 1 .
Некоторые жесткие ссылки:
% printf 'n="%s" ; ln ./realdir/file$n ./linkdir/link$n\n' `seq 1 100` |
. /dev/stdin
% du --inodes -S
> 101 ./realdir
> 1 ./linkdir
> 1 .
Посмотрите на жесткие ссылки:
% cd ./linkdir
% du --inodes -S
> 101
% cd ../realdir
% du --inodes -S
> 101
Они считаются в одиночку, но на один каталог вверх ...
% cd ..
% du --inodes -S
> 101 ./realdir
> 1 ./linkdir
> 1 .
Затем я запустил свой скрипт запуска снизу и:
> 100 /home/mikeserv/test/realdir
> 100 /home/mikeserv/test/linkdir
> 2 /home/mikeserv/test
И Грэм:
> 101 ./realdir
> 101 ./linkdir
> 3 ./
Так что я думаю, что это показывает, что единственный способ подсчитать inode - это inode. А поскольку подсчет файлов означает подсчет инодов, вы не можете вдвойне подсчитывать иноды - для точного подсчета файлов иноды не могут быть подсчитаны более одного раза.
OLD:
Я нахожу это быстрее, и это портативно:
sh <<-\CMD
{ echo 'here='"$PWD"
printf 'cd "${here}/%s" 2>/dev/null && {
set --
for glob in ".[!.]*" "[!.]*" ; do
set -- $glob "$@" &&
[ -e "./$1" ] || shift
done
printf "%%s\\t%%s\\n" $# "$PWD"
}\n' $( find . -depth -type d 2>/dev/null )
} | . /dev/stdin |
sort -rn |
sed -n \
'1,50{/^.\{71\}/s/^\(.\{30\}\).*\(.\{37\}\)$/\1...\2/;p}'
CMD
Это не обязательно -exec
для каждого каталога - он использует только один sh
процесс ell и один find
. Я должен получить set -- $glob
право по-прежнему включать .hidden
файлы и все остальное, но это очень близко и очень быстро. Вы бы просто cd
вошли в любой корневой каталог для проверки, и все готово.
Вот пример моего выходного прогона /usr
:
14684 /usr/share/man/man3
4322 /usr/lib
3650 /usr/bin
2454 /usr/share/man/man1
1897 /usr/share/fonts/75dpi
...
557 /usr/share/gtk-doc/html/gtk3
557 /usr/share/doc/elementary/latex
539 /usr/lib32/wine/fakedlls
534 /usr/lib/python2.7/site-packages/bzrlib
500 /usr/lib/python3.3/test
Я также использую sed
в нижней части, чтобы обрезать его до 50 лучших результатов. head
было бы быстрее, конечно, но я также обрежу каждую строку при необходимости:
...
159 /home/mikeserv/.config/hom...hhkdoolnlbekcfllmednbl/4.30_0/plugins
154 /home/mikeserv/.config/hom...odhpcledpamjachpmelml/1.3.11_0/js/ace
...
Правда, это грубо, но это была мысль. Другое использование я Неочищенный устройство сброса 2>stderr
для обоих find
и cd
в 2>/dev/null
. Это просто чище, чем смотреть на ошибки прав доступа для каталогов, которые я не могу прочитать без доступа root - возможно, мне следует это указать find
. Ну, это работа в процессе.
Итак, я исправил оболочки оболочки следующим образом:
for glob in ".[!.]*" "[!.]*" ; do
set -- $glob "$@" &&
[ -e "./$1" ] || shift
done
На самом деле я собирался задать вопрос о том, как это можно сделать, но когда я печатал в заголовке вопроса, сайт указал мне на предложенный связанный вопрос, где, о чудо, Стефан уже взвешен . Так что это было удобно. Очевидно [^.],
, что это хорошо поддерживается, но не переносимо, и вы должны использовать это, как !bang.
я обнаружил в комментарии Стефана.
В любом случае, очевидно, что просто потянуть скрытые файлы было недостаточно. Поэтому мне придется set
дважды, чтобы избежать поиска позиционеров для литерала $glob
. Тем не менее, это, похоже, никак не влияет на производительность и надежно добавляет каждый файл в каталог.