Найти последний файл по дате изменения

39

Если я хочу найти самый последний файл (mtime) в (большом) каталоге, содержащем подкаталоги, как мне это сделать?

Множество постов, которые я нашел, предлагают некоторые варианты ls -lt | head(забавно, многие предполагают, ls -ltr | tailчто это то же самое, но менее эффективно), что хорошо, если у вас нет подкаталогов (у меня есть).

Опять же, вы могли бы

find . -type f -exec ls -lt \{\} \+ | head

который определенно сделает то же самое для всех файлов, которые могут быть указаны одной командой, т. е. если у вас большой каталог, вы -exec...\+будете запускать отдельные команды; поэтому каждая группа будет отсортирована lsвнутри себя, но не по общему набору; Таким образом, головка получит последнюю запись первой партии.

Есть ответы?

command-line find

— Богатый
источник

Кстати, вам не нужно ни одного из всех этих обратных косых черт.

— энзотиб

@enzotib: ты делаешь ( \ + ), иначе получаешьfind: missing argument to '-exec'

— устраиваешь

@arrange: у меня нет этой ошибки, так как +она не имеет смысла bash, поэтому не нужно ее избегать.

— энзотиб

@enzotib: ты прав, моя ошибка, извини

— устраивай

46

Вам не нужно возвращаться к внешним командам (как ls), потому findчто вы можете делать все, что вам нужно, с помощью -printfдействия:

find /path -printf '%T+ %p\n' | sort -r | head

— enzotib
источник

1

Да, я придумал, find . -type f -exec stat --format=%y \{\} \+ | sort -r | head -n1но ваше решение намного чище!

— Богатый

3

Добавить, | cut -d ' ' -f2чтобы получить только имя файла

— qwr

Вы также можете отключить вывод, headчтобы включить определенное количество строк. Мне нужна была только первая строка, поэтому я использовалhead -n 1

— Тимма

8

У меня была похожая проблема сегодня, но я атаковал ее без find. Мне нужно было что-то короткое, чтобы я мог перебрать sshпоследний отредактированный файл в моем домашнем каталоге. Это примерно то, что я придумал:

ls -tp | grep -v /$ | head -1

-pОпция lsдобавляет слэш в каталогах, то grep -vудаляет строки , оканчивающиеся на слэш (ака, все каталоги), и head -1ограничивает выход в один файл.

Это гораздо менее многословно, чем использование, findесли все, что вы хотите вернуть, это имя файла.

— Пэт Риган
источник

Это не обрабатывает подкаталоги.

— Климент

4

Это в моей системе быстрее, чем printf, хотя я не понимаю, почему

find /path -type f -exec stat -c "%y %n" {} + | sort -r | head

— организовать
источник

Подтверждаю, скорее.

— энзотиб

Еще один момент, ... | sort -r | head -n1 | cut -d " " -f 4-если вы хотите получить только имя файла.

— 皞皞

Я только что нашел sort -rнеправильным, если существует имя файла в нескольких строках.

— 皞皞

2

РЕДАКТИРОВАТЬ: я думаю, что этот пост не "не особенно полезен", как я думал, что это было. Это действительно быстрое решение, которое просто отслеживает последний измененный файл (вместо сортировки всего списка файлов):

find . -type f -printf '%T@ %p\n' | awk 'BEGIN { mostrecenttime = 0; mostrecentline = "nothing"; } { if ($1 > mostrecenttime) { mostrecenttime = $1; mostrecentline = $0; } } END { print mostrecentline; }' | cut -f2- -d ' '

Для ясности распределите его по нескольким строкам:

find . -type f -printf '%T@ %p\n' | awk '
    BEGIN { mostrecenttime = 0; mostrecentline = "nothing"; }
    {
        if ($1 > mostrecenttime)
            { mostrecenttime = $1; mostrecentline = $0; }
    }
    END { print mostrecentline; }' | cut -f2- -d ' '

Конец РЕДАКТИРОВАНИЯ

Не очень полезный пост, но так как «аранжировка» обсуждала скорость, я решил поделиться этим.

Решения упорядочения и enzotib включают перечисление всех файлов в каталоге с их mtimes, а затем сортировку. Как известно, сортировка не нужна, чтобы найти максимум. Найти максимум можно за линейное время, но сортировка занимает n log (n) времени [я знаю, разница невелика, но все же;)]. Я не могу придумать изящный способ реализации этого. [РЕДАКТИРОВАТЬ: аккуратный (хотя грязный вид) и быстрая реализация, представленная выше.]

Следующая лучшая вещь - чтобы найти последний отредактированный файл в каталоге, рекурсивно найдите самый последний отредактированный файл в каждом подкаталоге уровня 1. Пусть этот файл представляет подкаталог. Теперь сортируйте файлы уровня 1 вместе с представителями подкаталогов уровня 1. Если количество файлов уровня 1 и подкаталогов в каждом каталоге почти постоянное, то этот процесс должен линейно масштабироваться с общим количеством файлов.

Вот что я придумал, чтобы реализовать это:

findrecent() { { find "$1" -maxdepth 1 -type f -exec stat -c "%y %n" {} + | sort -r | head -1 && find "$1" -mindepth 1 -maxdepth 1 -type d -exec findrecent {} \;; } | sort -r | head -1; }
findrecent .

Я запустил это и получил кучу find: findrecent: No such file or directoryошибок. Причина: -exec команды find выполняется в другой оболочке. Я попытался определить findrecent в .bashrc, .xsessionrc, но это не помогло [я был бы признателен за помощь здесь]. В конце концов я прибегнул к

#!/bin/bash
{ find "$1" -maxdepth 1 -type f -exec stat -c "%y %n" {} + | sort -r | head -1 && find "$1" -mindepth 1 -maxdepth 1 -type d -exec findrecent {} \;; } | sort -r | head -1;

в сценарии, вызванном findrecentв моем PATH, а затем запустить его.

Я запустил это, продолжал ждать и ждать без выхода. Просто чтобы убедиться, что я не имел дело с бесконечными циклами, я изменил файл

#!/bin/bash
echo "$1" >&2
{ find "$1" -maxdepth 1 -type f -exec stat -c "%y %n" {} + | sort -r | head -1 && find "$1" -mindepth 1 -maxdepth 1 -type d -exec findrecent {} \;; } | sort -r | head -1;

и попробовал еще раз. Это сработало - но заняло 1 минуту 35 секунд в моей домашней папке - решения аранжировки и энзотиба заняли 1,69 и 1,95 секунды соответственно!

Вот вам и превосходство O (n) над O (n log (n))! Черт возьми, функция вызова накладных расходов! [Или скорее сценарий вызова накладных расходов]

Но этот скрипт масштабируется лучше, чем предыдущие решения, и я уверен, что он будет работать быстрее, чем они в банке памяти Google; D

— S Prasanth
источник

2

использование perl в сочетании с find:

 find my_directory -type f -printf '%T@\t%p\n' | perl -ane '@m=@F if ($F[0]>$m[0]); END{print $m[1];}'

Вы получите имя файла с наибольшей эпохой == последний измененный файл.

— MUY Бельгия
источник

1

Это не так модно, но также возможно достичь этого с Midnight Commander : искать *, группировать результаты, сортировать по времени изменения в обратном порядке.

Очевидно, это немного медленнее, чем find- мой домашний каталог, содержащий 922000 файлов, был отсортирован mcпочти за 14 минут, а findпотрачено менее 5 - но есть некоторые преимущества:

Вероятно, я бы потратил больше, чем разница в 9 минут, придумывая правильный вызов find :)
меньше шансов на ошибку (забыл указать -r для сортировки и т. д. - начать заново)
можно поиграть с результирующим набором, изменив порядок сортировки и т. д. - без повторного запроса файлов.
можно выполнять файловые операции только над некоторыми файлами из результирующего набора - т.е. сортировать по размеру, удалять несколько больших файлов, которые не нужны

— Сергей
источник