Вопросы с тегом «text-processing»

Манипулирование или изучение текста с помощью программ, сценариев и т. Д.

1
Как выполнить числовую сортировку по последнему столбцу?
У меня есть этот вход: sdkxyosl 1 safkls 2 asdf--asdfasxy_asd 5 dkd8k jasd 29 sdi44sw 43 asasd afsdfs 10 rklyasd 4 Мне нужен этот вывод: sdi44sw 43 dkd8k jasd 29 asasd afsdfs 10 asdf--asdfasxy_asd 5 rklyasd 4 safkls 2 sdkxyosl 1 Поэтому мне нужно отсортировать строки по последнему столбцу. Я …

2
Трубы, как поток данных в конвейере?
Я не понимаю, как данные передаются по конвейеру, и надеюсь, что кто-то сможет прояснить, что там происходит. Я думал, что конвейер команд обрабатывает файлы (текст, массивы строк) построчно. (Если каждая команда работает построчно.) Каждая строка текста проходит через конвейер, команды не ждут, пока предыдущая закончит обработку всего ввода. Но, похоже, …

17
Как найти строку с наименьшим количеством символов
Я пишу сценарий оболочки, используя любые общие команды UNIX. Я должен получить строку, которая имеет наименьшее количество символов (включая пробелы). Там может быть до около 20 строк. Я знаю, что могу использовать, head -$L | tail -1 | wc -mчтобы найти количество символов в строке L. Проблема в том, что …

1
Сортировать данные в порядке убывания первого столбца, для одинаковых значений использовать второй столбец в порядке возрастания
Позвольте мне уточнить: Предположим, у меня есть несколько ключевых слов с частотой их использования: 12 Hi 7 Hash 7 C++ 9 Superuser 17 Stackoverflow 9 LaTeX 42 Life 9 Ubuntu Я хочу отсортировать эти данные по частоте в порядке убывания, и, если есть какие-то равные значения, следует использовать второй столбец …

6
Преобразование форм нормализации Unicode в командной строке Unix
В Unicode некоторые комбинации символов имеют более одного представления. Например, символ ä может быть представлен как «ä», то есть кодовая точка U + 00E4 (два байта c3 a4в кодировке UTF-8) или как «ä», то есть две кодовые точки U + 0061 U + 0308 (три байта 61 cc 88в UTF-8). …

4
sed - заменить строку содержимым файла
У меня есть два файла: file1и file2. file1 имеет следующее содержание: --- host: "localhost" port: 3000 reporter_type: "zookeeper" zk_hosts: - "localhost:2181" file2содержит IP-адрес ( 1.1.1.1) То , что я хочу сделать , это заменить localhostс 1.1.1.1, так что конечный результат: --- host: "1.1.1.1" port: 3000 reporter_type: "zookeeper" zk_hosts: - "1.1.1.1:2181" …

4
Возможно ли в bash начать чтение файла с произвольного смещения байтов?
Я хочу найти дату, которая находится где-то в журнале 8 ГБ (текст). Могу ли я несколько обойти полное последовательное чтение и сначала выполнить двоичное разбиение файла (размер) или каким-либо образом перемещаться по файловой системе inodes(о которой я очень мало знаю ), чтобы начать чтение с каждой точки разделения, пока не …

7
Нежадное совпадение с регулярным выражением SED (эмулирует perl. *?)
Я хочу использовать sedдля замены чего-либо в строке между первым ABи первым появлением AC(включительно) на XXX. К примеру , у меня есть эта строка (эта строка только для теста): ssABteAstACABnnACss и я хотел бы вывод , подобный этому: ssXXXABnnACss. Я сделал это с perl: $ echo 'ssABteAstACABnnACss' | perl -pe …

7
tail -f, но с номерами строк
Я пытаюсь увидеть, сколько раз foo barв /var/log/foo.logтечение произвольного промежутка времени появляется на удаленном сервере, но ничего из того, что я пробовал до сих пор, не сработало. У меня уже есть сценарий таймера, который я использую для отслеживания того, сколько времени прошло с тех пор, как я начал хвастаться /var/log/foo.log, …

4
разделить длинную строку на разделитель
Какую команду я могу использовать для разделения ввода следующим образом: foo:bar:baz:quux в это? foo bar baz quux Я пытаюсь выяснить cutкоманду, но, кажется, она работает только с фиксированным количеством ввода, например, «первые 1000 символов» или «первые 7 полей». Мне нужно работать с произвольно длинным вводом.

6
Командная строка дружественные таблицы
Существует ли такая вещь? Текстовые таблицы, которые хорошо отображаются в среде CLI. Я знаю, что могу cat foobar.csvи делаю, как хочу, но это не особенно практично и не привлекательно. Я не могу себе представить, что будет трудно отформатировать таблицу, и, возможно, следовать определенным правилам (математике?). В Emacs org-modeдостаточно хорошо обрабатывается …

4
Как удалить остаток каждой строки после определенного шаблона или строки в файле?
Предположим, у меня есть список URL-адресов в текстовом файле: google.com/funny unix.stackexchange.com/questions isuckatunix.com/ireallydo Я хочу удалить все, что идет после «.com». Ожидаемые результаты: google.com unix.stackexchange.com isuckatunix.com Я старался sed 's/.com*//' file.txt но он также удален .com.

13
Как я могу удалить все комментарии из файла?
У меня есть файл с комментариями: foo bar stuff #Do not show this... morestuff evenmorestuff#Or this Я просто хочу напечатать весь некомментированный код: foo bar stuff morestuff evenmorestuff Возможность извлечения комментариев из файла очень важна ... Какой хороший способ сделать это?

3
Как добавить номера строк в каждую строку, используя команду оболочки?
Мой файл, PSS-A (Primary A) PSS-B (Primary B) PSS-C (Primary C) PSS-D (Primary D) PSS-E (Primary E) PSS-F (Primary F) PSS-G (Primary G) PSS-H (Primary H) PSS-I (Primary I) SPARE (SPARE) Выходной файл, 1> PSS-A (Primary A) 2> PSS-B (Primary B) 3> PSS-C (Primary C) 4> PSS-D (Primary D) 5> …

2
найти общие линии между несколькими файлами
у меня есть 4 файла, которые похожи file A >TCONS_00000867 >TCONS_00001442 >TCONS_00001447 >TCONS_00001528 >TCONS_00001529 >TCONS_00001668 >TCONS_00001921 file b >TCONS_00001528 >TCONS_00001529 >TCONS_00001668 >TCONS_00001921 >TCONS_00001922 >TCONS_00001924 file c >TCONS_00001529 >TCONS_00001668 >TCONS_00001921 >TCONS_00001922 >TCONS_00001924 >TCONS_00001956 >TCONS_00002048 file d >TCONS_00001922 >TCONS_00001924 >TCONS_00001956 >TCONS_00002048 Все файлы содержат более 2000 строк и отсортированы по первому столбцу. …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.