Вопросы с тегом «text-processing»

Манипулирование или изучение текста с помощью программ, сценариев и т. Д.

1
Как «grep» для длины строки * не * в заданном диапазоне?
ПРИМЕЧАНИЕ: этот вопрос является дополнением к этому Q & A: Как «grep» для длины линии в заданном диапазоне? Как мы можем выполнить поиск строк, которые содержат менее 8 или более 63 символов, ни одна из которых не содержит более восьми и менее 63 символов? Таким образом, некоторые приемлемые числа символов …

4
Поиск текста между двумя конкретными символами или строками
Скажем, у меня есть такие строки: *[234]* *[23]* *[1453]* где *представляет любую строку (кроме строки в форме [number]). Как я могу проанализировать эти строки с помощью утилиты командной строки и извлечь число в скобках? В более общем смысле , какой из этих инструментов cut, sed, grepили было awkбы целесообразно для …

6
Команда типа `column -t`, которая вместо этого сохраняет разделители в выводе
Я редактирую простую таблицу. Я хотел бы, чтобы это было красиво отформатировано. Хотя я мог бы использовать tbl, latexили подобное, это кажется излишним - простого текста действительно достаточно. Поскольку это просто, я мог бы также иметь источник, чтобы быть выходом. Так что источник тоже должен хорошо выглядеть. Кажется, что это …

7
Повторите каждую строку несколько раз
Хотелось бы, чтобы каждая строка в файле повторялась фиксированное количество раз. например, каждая строка повторяется четыре раза: a b c будет выглядеть так: a a a a b b b b c c c c Я провел некоторый поиск, и есть много вопросов и ответов, в том числе и в …

2
Извлечь среднюю часть строк из текстового файла?
Я пишу сценарий PHP для анализа большого текстового файла, чтобы сделать из него вставки базы данных. Однако на моем хосте файл слишком велик, и я достиг предела памяти для PHP. Файл имеет около 16 000 строк; Я хочу разделить его на четыре отдельных файла (сначала), чтобы посмотреть, смогу ли я …

4
Как я grep без ведущих пробелов?
Я использую большую кодовую базу, и ведущие пробелы и табуляции кажутся довольно раздражающими. Есть ли способ избавиться от этого? grep -R "something" ./ Например, вместо: foo/bar.cpp: qwertyuiosomethingoi foo/bar/baz.h: 43rfsgsomethingdrfg bar/bar.cpp: 1234edwssomethingczd Я хочу получить что-то вроде: foo/bar.cpp: qwertyuiosomethingoi foo/bar/baz.h: 43rfsgdsomethingrfg bar/bar.cpp: 1234edwssomethingczd Или лучше: foo/bar.cpp: qwertyuisomethingooi foo/bar/baz.h: 43rfsgdrsomethingfg bar/bar.cpp: 1234edwssomethingczd

3
Ищите старый классический учебник по Unix
Я ищу книгу о наборе инструментов командной строки Unix (sh, grep, sed, awk, cut и т. Д.), Которую я прочитал некоторое время назад. Это была отличная книга, но я полностью забыл ее название. Самое замечательное в этой конкретной книге - это яркий пример. Он показал, как внедрить систему бухгалтерского учета …

9
Превратить список в одну строку с разделителем
Я должен взять список (загрузки) IP-адресов в этом формате: 134.27.128.0 111.245.48.0 109.21.244.0 и превратить их в этот формат с промежуточным каналом (IP-адреса составлены) 134.27.128.0 | 111.245.48.0 | 109.21.244.0 | 103.22.200.0/22 Я думаю, что это команда поиска и замены, sedно я не могу заставить ее работать.

3
Заменить многострочную строку в файлах
У меня есть несколько файлов, которые я хочу обновить, заменив одну многострочную строку другой многострочной. Что-то вроде: * Some text, * something else * another thing И я хочу заменить его на: * This is completely * different text В результате будет получено, что после замены файл, содержащий первый блок …

3
Подсчитать различные значения поля в файле
У меня есть файл, содержащий около миллиона строк. В строках у меня есть поле с именем transactionid, которое имеет повторяющиеся значения. Что мне нужно сделать, так это считать их отчетливо. Независимо от того, сколько раз значение повторяется, оно должно учитываться только один раз.

3
awk: форсировать возвращение статуса?
Это продолжение моего предыдущего вопроса . Я проверяю количество полей в / etc / passwd, используя этот удобный фрагмент. В следующем примере пользователи 'fieldcount1' и 'fieldcount2' имеют неправильное количество полей: $ awk -F: ' NF!=7 {print}' /etc/passwd fieldcount1:x:1000:100:fieldcount1:/home/fieldcount1:/bin/bash:::: fieldcount2:blah::blah:1002:100:fieldcount2:/home/fieldcount2:/bin/bash: $ echo $? 0 Как вы заметите, awk выйдет со статусом …

5
Как я могу удалить все до шаблона и все после другого шаблона из линии?
В следующем файле: Lorem Ipsum Dolor Sit Amet, посвященный Aditiscing Elit. Ut eu metus id lectus vestibulum ultrices. Меценатский хрип Я хочу удалить все до consectetuerи все после elit. Мой желаемый результат: consectetuer adipiscing elit. Как я могу это сделать?


12
Удалить дубликаты попарно?
Я столкнулся с этим вариантом использования сегодня. Это кажется простым , на первый взгляд, но возиться с sort, uniq, sedи awkвыяснилось , что это нетривиально. Как я могу удалить все пары повторяющихся строк? Другими словами, если есть четное количество дубликатов данной строки, удалите все из них; если есть нечетное количество …


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.