Вопросы с тегом «text-processing»

Манипулирование или изучение текста с помощью программ, сценариев и т. Д.


5
Как взять абсолютное значение с помощью awk?
Если у меня есть ниже двух дат: 2015-09-12,2015-08-13 И мне нужно получить количество дней между ними, я буду использовать следующий код: awk -F'[-,]' '{print 360*($4-$1)+30*($5-$2)+($6-$3)}' Выход для этого кода будет в то -29время как на самом деле разница29

5
Удалите повторяющиеся строки, сохраняя порядок строк
[root@server]# awk '!seen[$0]++' out.txt > cleaned awk: (FILENAME=out.txt FNR=8547098) fatal error: internal error Aborted [root@server]# «Сервер» имеет: 8 ГБ ОЗУ + 16 ГБ SWAP, x> 300 ГБ свободного места, amd64, настольный ЦП. Научный Linux 6.6. На нем больше ничего не работает, чтобы сделать LOAD. Awk прерывается через несколько секунд .. …

9
Отфильтровать или передать определенные разделы файла
У меня есть входной файл с некоторыми разделами, которые разграничены начальным и конечным тегами, например: line A line B @@inline-code-start line X line Y line Z @@inline-code-end line C line D Я хочу применить преобразование к этому файлу так, чтобы строки X, Y, Z фильтровались через какую-то команду ( nlнапример), …

3
SED соответствует шаблону N раз
Я хочу разбить файл на куски по 2 слова в каждом. $cat tmp word1 word2 word3 word4 word5 word6 word7 $sed -e 's/word. word. /&\n/g' tmp word1 word2 word3 word4 word5 word6 word7 $sed -e 's/word. \{2\}/&\n/g' tmp word1 word2 word3 word4 word5 word6 word7 Я ожидал, что последняя команда …

5
Замена шаблона соответствия случая с помощью sed
У меня есть исходный код, распределенный по нескольким файлам. У него есть шаблон, abcdefкоторый мне нужно заменить pqrstuvxyz. Шаблон может быть Abcdef(Случай предложения), тогда его нужно заменить на Pqrstuvxyz. Шаблон может быть AbCdEf(случай переключения), тогда его необходимо заменить на PqRsTuVxYz. Короче говоря, мне нужно сопоставить регистр исходного шаблона и применить …

2
Почему эта команда xargs не работает?
Я хотел удалить все расширения .sh, поэтому сделал это: ls *.sh | xargs -I {} mv {} `basename {} .sh` Однако это не работает, оно ведет себя как basenameвозвращает неизменное имя файла. Почему так себя ведет? Например, это работает: ls *.sh | xargs -I {} echo `basename {}.jpg .jpg`; РЕДАКТИРОВАТЬ …

3
Как массово преобразовать все файлы в ветке файловой системы между Unix и Windows форматом разрыва строки?
Всем известно :-), что в Windows строки текстовых файлов заканчиваются на CR + LF, а в Unix и Linux - только на LF. Как я могу быстро конвертировать все мои файлы исходного кода из одного формата в другой и обратно?

3
tail -f, вставить разрыв строки после того, как журнал простаивает в течение 3 секунд?
При выполнении tail -f error.log, как программно вставить разрыв строки после того, как ничего не было добавлено в файл в течение 3 секунд? (очевидно, как только один разрыв строки был добавлен, никакой другой разрыв строки не должен быть добавлен, пока другие строки текста не будут добавлены в файл журнала) Например, …

7
Проверьте, все ли строки файла находятся в разных файлах
Я получил два файла: file1 с примерно 10 000 строк и file2 с несколькими сотнями строк. Я хочу проверить, все ли строки file2 встречаются в file1. То есть: ∀ строка ℓ ∈ файл2: ℓ ∈ файл1 Если кто-то не знает, что означают эти символы или что означает «проверить, все ли …

7
Как выполнить grep -v и исключить следующую строку после матча?
Как отфильтровать 2 строки для каждой строки, соответствующей регулярному выражению grep? это мой минимальный тест: SomeTestAAAA EndTest SomeTestABCD EndTest SomeTestDEFG EndTest SomeTestAABC EndTest SomeTestACDF EndTest И, очевидно, я пытался, например, grep -vA 1 SomeTestAAкоторый не работает. желаемый результат: SomeTestABCD EndTest SomeTestDEFG EndTest SomeTestACDF EndTest


4
Вывести часть каждой строки в отдельный файл
У меня есть файл, как это: a AGTACTTCCAGGAACGGTGCACTCTCC b ATGGATTTTTGGAGCAGGGAGATGGAATAGGAGCATGCTCCAT c ATATTAAATGGATTTTTGGAGCAGGGAGATGGAATAGGAGCATGCTCCATCCACTCCACAC d ATCAGTTTAATATCTGATACGTCCTCTATCCGAGGACAATATATTAAATGGA e TTTGGCTAAGATCAAGTGTAGTATCTGTTCTTATAAGTTTAATATCTGATATGTCCTCTATCTGA Я хочу сделать файл, a.seqкоторый содержит последовательность AGTACTTCCAGGAACGGTGCACTCTCC. Аналогично b.seqсодержит ATGGATTTTTGGAGCAGGGAGATGGAATAGGAGCATGCTCCAT. Короче говоря, Column1 следует использовать в качестве имени выходного файла с расширением, .seqа затем в нем должна быть соответствующая последовательность column2. Я могу …

2
iconv Недопустимая последовательность ввода - почему?
При попытке преобразовать текстовый файл в его ASCII-эквивалент я получаю сообщение об ошибке iconv: illegal input sequence at position. Я использую команду iconv -f UTF-8 -t ascii//TRANSLIT file Оскорбительный персонаж есть æ. Сам текстовый файл присутствует здесь . Почему это говорит о недопустимой последовательности? Вводимый символ является правильным символом UTF-8 …

2
Что такое python-эквивалент grep -v?
Мне нравится grep -v. Я использую это все время. Но я также занимаюсь некоторой обработкой текста на python, и мне не хватает одной важной вещи. Обычно я использую grep -vдля извлечения посторонние вещи из текста. Например, $ grep -v '[a-z]' # (I manually review this output to confirm that I …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.