Как разделить многострочную строку на несколько строк?

287

У меня есть многострочный строковый литерал, который я хочу сделать для каждой строки, например, так:

inputString = """Line 1
Line 2
Line 3"""

Я хочу сделать что-то вроде следующего:

for line in inputString:
    doStuff()

python string

— bradtgmurray
источник

438

inputString.splitlines()

Даст вам список с каждым элементом, splitlines()метод предназначен для разделения каждой строки на элемент списка.

— UnkwnTech
источник

12

+1. Я думаю, что это лучше, чем принятое решение, потому что оно явно не связывается с разделителем строк. Все это работает только с помощью специального метода API!

— lpapp

12

@ lpapp, я полностью согласен. splitlines () семантически (и функционально, так как он использует универсальные символы новой строки и пропускает завершающую пустую строку) лучше, чем split ('\ n'). Тогда (2008) я был просто новичком в Pythonista, но мои сценарии теперь показывают, что я тоже использую splitlines () почти исключительно. Поэтому я удаляю свой 104-точечный ответ ( * всхлип ... * ) и вместо этого буду одобрять этот.

— efotinis

18

Это также делает ''.splitlines() == [], ['']а не как с ''.split('\n').

— rightfold

198

Как и другие говорили:

inputString.split('\n')  # --> ['Line 1', 'Line 2', 'Line 3']

Это идентично вышеописанному, но функции строкового модуля устарели и их следует избегать:

import string
string.split(inputString, '\n')  # --> ['Line 1', 'Line 2', 'Line 3']

В качестве альтернативы, если вы хотите, чтобы каждая строка включала последовательность разрыва (CR, LF, CRLF), используйте splitlinesметод с Trueаргументом:

inputString.splitlines(True)  # --> ['Line 1\n', 'Line 2\n', 'Line 3']

— efotinis
источник

12

Это будет работать только в системах, которые используют \ n в качестве ограничителя строки.

— Джереми Кантрелл

20

@Jeremy: строковые литералы в тройных кавычках всегда используют EOL '\ n', независимо от платформы. Так что файлы читать в текстовом режиме.

— efotinis

16

inputString.split(os.linesep)будет использовать ограничитель линии для конкретной платформы.

— Джеймс

10

Странно, что за этот ответ так проголосовали. Жесткое кодирование '\ n' - плохая идея, но даже если вместо этого вы используете os.linesep, у вас будут проблемы с окончанием строки Windows в Linux и наоборот, и т. Д. Кроме того, он продвигает разделенные линии с аргументом True, который вероятно, менее распространенный способ его использования ...

— lpapp

4

Комбинация неоптимального метода, устаревшего метода и избыточной вариации оптимального метода.

— JWG

50

Использованиеstr.splitlines() .

splitlines()обрабатывает переводы строк правильно, в отличие от split("\n").

Он также имеет преимущество, упомянутое @efotinis, заключающееся в необязательном включении символа новой строки в результат разделения при вызове с Trueаргументом.

Подробное объяснение того, почему вы не должны использовать split("\n"):

\nв Python представляет разрыв строки Unix (десятичный код ASCII 10) независимо от платформы, на которой вы его запускаете. Однако представление переноса строки зависит от платформы . В Windows \nэто два символа CRи LF(десятичные коды ASCII 13 и 10, AKA \rи \n), а в любом современном Unix (включая OS X) это один символ LF.

printНапример, работает правильно, даже если у вас есть строка с окончаниями строки, которые не соответствуют вашей платформе:

>>> print " a \n b \r\n c "
 a 
 b 
 c

Однако явное разбиение на «\ n» приведет к зависимому от платформы поведению:

>>> " a \n b \r\n c ".split("\n")
[' a ', ' b \r', ' c ']

Даже если вы используете os.linesep, он будет разделяться только в соответствии с разделителем новой строки на вашей платформе и завершится ошибкой, если вы обрабатываете текст, созданный на других платформах, или с пустым \n:

>>> " a \n b \r\n c ".split(os.linesep)
[' a \n b ', ' c ']

splitlines решает все эти проблемы:

>>> " a \n b \r\n c ".splitlines()
[' a ', ' b ', ' c ']

Чтение файлов в текстовом режиме частично смягчает проблему представления новой строки, поскольку она преобразует Python \nв представление новой строки платформы. Однако текстовый режим существует только в Windows. В системах Unix все файлы открываются в двоичном режиме, поэтому использование split('\n')в системе UNIX с файлом Windows приведет к нежелательному поведению. Кроме того, нет ничего необычного в обработке строк с потенциально новыми символами новой строки из других источников, например из сокета.

— goncalopp
источник

Сравнение несправедливо, потому что вы также можете использовать split (os.linesep), чтобы избежать специфического для платформы бита.

— lpapp

6

Примечание @lpapp, которое splitlinesбудет разбиваться на любом конце строки. split(os.linesep)произойдет сбой при чтении файла Windows в Unix, например

— goncalopp

1

Еще одна причина для использования splitline в моем случае, спасибо. Я дал +1. Я бы лично включил информацию в комментариях в ваш ответ.

— lpapp

20

Может быть излишним в этом конкретном случае, но другой вариант предполагает использование StringIOдля создания файлового объекта

for line in StringIO.StringIO(inputString):
    doStuff()

— Iruvar
источник

Да, это самый идиоматичный, самый Python-ic подход.

— Парамагнитный круассан

4

Преимущество этого метода по сравнению с тем str.split, что нет необходимости выделять какую-либо память (он читает строку на месте). Недостатком является то, что при использованииStringIO он работает намного медленнее (примерно в 50 раз). Если вы используете cStringIO, однако, это примерно в 2 раза быстрее

— goncalopp

В 2 раза быстрее чем?

— Ирина Рапопорт

1

@IrinaRapoport, cStringIO в 2 раза быстрее, чем StringIO

— iruvar

1

Исходная запись запрашивала код, который печатает несколько строк (если они верны для некоторого условия) плюс следующую строку. Моя реализация будет такой:

text = """1 sfasdf
asdfasdf
2 sfasdf
asdfgadfg
1 asfasdf
sdfasdgf
"""

text = text.splitlines()
rows_to_print = {}

for line in range(len(text)):
    if text[line][0] == '1':
        rows_to_print = rows_to_print | {line, line + 1}

rows_to_print = sorted(list(rows_to_print))

for i in rows_to_print:
    print(text[i])

— Финрод Фелагунд
источник

0

Мне бы хотелось, чтобы комментарии имели правильное форматирование текста кода, потому что я думаю, что ответ @ 1_CR нуждается в большем количестве ухабов, и я хотел бы дополнить его ответ. Во всяком случае, он привел меня к следующей технике; он будет использовать cStringIO, если он доступен (НО ЗАМЕЧАНИЕ: cStringIO и StringIO не совпадают , потому что вы не можете создать подкласс cStringIO ... это встроенный ... но для основных операций синтаксис будет идентичным, так что вы можете сделать это ):

try:
    import cStringIO
    StringIO = cStringIO
except ImportError:
    import StringIO

for line in StringIO.StringIO(variable_with_multiline_string):
    pass
print line.strip()

— Майк С
источник