Вопросы с тегом «text-processing»

Манипулирование или изучение текста с помощью программ, сценариев и т. Д.

4
объединить два текстовых файла с добавлением разделителя между ними?
cat file1 file2объединит два текстовых файла. Но если я хочу добавить какой-то разделитель, например, одну или две строки ********************************, мне нужно открыть первый файл и добавить строку в его конце, или открыть второй файл и добавить строку вверху, а затем запустить catкоманда? Это можно сделать, просто запустив команду?

2
Инструмент в Unix для вычитания текстовых файлов?
У меня есть большой файл, состоящий из текстовых полей, разделенных точками с запятой в виде большой таблицы. Это было отсортировано. У меня есть файл меньшего размера, состоящий из тех же текстовых полей. В какой-то момент кто-то связал этот файл с другими, а затем сделал сортировку, чтобы сформировать большой файл, описанный …


4
сравнить два столбца разных файлов и распечатать, если он совпадает
Я использую Solaris 10, поэтому параметры grep, включающие -f, не работают. У меня есть два файла, разделенных каналом: file1: abc|123|BNY|apple| cab|234|cyx|orange| def|kumar|pki|bird| файл 2: abc|123| kumar|pki| cab|234 Я хотел бы сравнить первые два столбца файла file2 с файлом file1 (поиск по всему содержимому файла file1 в первых двух столбцах), если …

8
Заменить строку, содержащую новую строку в огромном файле
Кто-нибудь знает инструмент, не основанный на строках, для «бинарного» поиска / замены строк в некотором смысле эффективным способом памяти? Смотрите и этот вопрос . У меня есть текстовый файл + 2 ГБ, который я хотел бы обработать аналогично тому, как это выглядит: sed -e 's/>\n/>/g' Это означает, что я хочу …

2
Печать строк между (и включая) двумя рисунками
Я хочу начать расчистку со строк, которые имеют CKв конце строки, и прекратить сопоставление, когда строка имеет Dв конце. Я пытался grep "$CK" "$D" file..txt, но это не сработало. Входные данные: kkkkkkkkkkk jjjjjjjjjjjjjjjjjj gggggggggggg/CK JHGHHHHHHHH HJKHKKLKLLL JNBHBHJKJJLKKL JLKKKLLKJLKJ/D GGGGGGGGGGGGGG GGGGGGGGGGGGGG Желаемый вывод: gggggggggggg/CK JHGHHHHHHHH HJKHKKLKLLL JNBHBHJKJJLKKL JLKKKLLKJLKJ/D


1
Как удалить повторяющиеся строки в большом текстовом файле размером в несколько ГБ?
Мой вопрос похож на этот вопрос, но имеет несколько ограничений: У меня большой список \nслов с разделителями - по одному слову в строке. Размер файлов варьируется от 2 ГБ до 10 ГБ. Мне нужно удалить любые дубликаты строк. Процесс может сортировать список в процессе удаления дубликатов, но не обязателен. В …

5
Найти файлы, которые содержат несколько ключевых слов в любом месте файла
Я ищу способ перечислить все файлы в каталоге, которые содержат полный набор ключевых слов, которые я ищу, в любом месте файла. Таким образом, ключевые слова не должны появляться в одной строке. Один из способов сделать это будет: grep -l one $(grep -l two $(grep -l three *)) Три ключевых слова …

4
Сохранить вывод команды в кольцевой буфер
У меня есть длительная команда, которая генерирует большой вывод на стандартный вывод. Я хотел бы иметь возможность сохранить, например, только последние три дня или последний гибибайт (избегая линий разреза посередине) и, если возможно, в файловых фрагментах размером не более 20 МБ. Каждому фрагменту файла присваивается числовой суффикс или отметка времени. …


5
Как найти и заменить строку без использования команды Sed?
Как мы все знаем, sedявляется очень эффективным , чтобы найти и заменить строку, например , находка «а» и заменить его на «Ъ»: sed 's/a/b/g'. Возможно ли сделать это с помощью другой команды или сценария оболочки вместо sed? Это для обрезанных систем Linux для телевидения, которые не имеют sedкоманды. Поэтому я …

3
awk + print line только если первое поле начинается со строки как Linux1
как напечатать строку, если первое поле начинается с Linux1 например: echo Linux1_ver2 12542 kernel-update | awk '{if ($1 ~ Linux1 ) print $0;}' цель состоит в том, чтобы напечатать строку, в то время как первое поле начинается с Linux1 пример строк: Linux1-new 36352 Version:true Linux1-1625543 9847 Linux1:16254 8467563 примечание - …

3
голова ест лишних персонажей
Ожидается, что следующая команда оболочки выведет только нечетные строки входного потока: echo -e "aaa\nbbb\nccc\nddd\n" | (while true; do head -n 1; head -n 1 >/dev/null; done) Но вместо этого он просто печатает первую строку: aaa. То же самое не происходит, когда он используется с опцией -c( --bytes): echo 12345678901234567890 | …

5
Объединение большого количества файлов
У меня есть ± 10000 файлов ( res.1- res.10000), все состоящие из одного столбца и равного количества строк. То, что я хочу, по сути, просто; объединить все файлы по столбцам в новый файл final.res. Я пытался с помощью: paste res.* Однако (хотя это , кажется, работает для небольшого подмножества результирующих …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.