У меня есть многострочный строковый литерал, который я хочу сделать для каждой строки, например, так:
inputString = """Line 1
Line 2
Line 3"""
Я хочу сделать что-то вроде следующего:
for line in inputString:
doStuff()
У меня есть многострочный строковый литерал, который я хочу сделать для каждой строки, например, так:
inputString = """Line 1
Line 2
Line 3"""
Я хочу сделать что-то вроде следующего:
for line in inputString:
doStuff()
Ответы:
inputString.splitlines()
Даст вам список с каждым элементом, splitlines()
метод предназначен для разделения каждой строки на элемент списка.
''.splitlines() == []
, ['']
а не как с ''.split('\n')
.
Как и другие говорили:
inputString.split('\n') # --> ['Line 1', 'Line 2', 'Line 3']
Это идентично вышеописанному, но функции строкового модуля устарели и их следует избегать:
import string
string.split(inputString, '\n') # --> ['Line 1', 'Line 2', 'Line 3']
В качестве альтернативы, если вы хотите, чтобы каждая строка включала последовательность разрыва (CR, LF, CRLF), используйте splitlines
метод с True
аргументом:
inputString.splitlines(True) # --> ['Line 1\n', 'Line 2\n', 'Line 3']
inputString.split(os.linesep)
будет использовать ограничитель линии для конкретной платформы.
Использованиеstr.splitlines()
.
splitlines()
обрабатывает переводы строк правильно, в отличие от split("\n")
.
Он также имеет преимущество, упомянутое @efotinis, заключающееся в необязательном включении символа новой строки в результат разделения при вызове с True
аргументом.
Подробное объяснение того, почему вы не должны использовать split("\n")
:
\n
в Python представляет разрыв строки Unix (десятичный код ASCII 10) независимо от платформы, на которой вы его запускаете. Однако представление переноса строки зависит от платформы . В Windows \n
это два символа CR
и LF
(десятичные коды ASCII 13 и 10, AKA \r
и \n
), а в любом современном Unix (включая OS X) это один символ LF
.
print
Например, работает правильно, даже если у вас есть строка с окончаниями строки, которые не соответствуют вашей платформе:
>>> print " a \n b \r\n c "
a
b
c
Однако явное разбиение на «\ n» приведет к зависимому от платформы поведению:
>>> " a \n b \r\n c ".split("\n")
[' a ', ' b \r', ' c ']
Даже если вы используете os.linesep
, он будет разделяться только в соответствии с разделителем новой строки на вашей платформе и завершится ошибкой, если вы обрабатываете текст, созданный на других платформах, или с пустым \n
:
>>> " a \n b \r\n c ".split(os.linesep)
[' a \n b ', ' c ']
splitlines
решает все эти проблемы:
>>> " a \n b \r\n c ".splitlines()
[' a ', ' b ', ' c ']
Чтение файлов в текстовом режиме частично смягчает проблему представления новой строки, поскольку она преобразует Python \n
в представление новой строки платформы. Однако текстовый режим существует только в Windows. В системах Unix все файлы открываются в двоичном режиме, поэтому использование split('\n')
в системе UNIX с файлом Windows приведет к нежелательному поведению. Кроме того, нет ничего необычного в обработке строк с потенциально новыми символами новой строки из других источников, например из сокета.
splitlines
будет разбиваться на любом конце строки. split(os.linesep)
произойдет сбой при чтении файла Windows в Unix, например
Может быть излишним в этом конкретном случае, но другой вариант предполагает использование StringIO
для создания файлового объекта
for line in StringIO.StringIO(inputString):
doStuff()
str.split
, что нет необходимости выделять какую-либо память (он читает строку на месте). Недостатком является то, что при использованииStringIO
он работает намного медленнее (примерно в 50 раз). Если вы используете cStringIO
, однако, это примерно в 2 раза быстрее
Исходная запись запрашивала код, который печатает несколько строк (если они верны для некоторого условия) плюс следующую строку. Моя реализация будет такой:
text = """1 sfasdf
asdfasdf
2 sfasdf
asdfgadfg
1 asfasdf
sdfasdgf
"""
text = text.splitlines()
rows_to_print = {}
for line in range(len(text)):
if text[line][0] == '1':
rows_to_print = rows_to_print | {line, line + 1}
rows_to_print = sorted(list(rows_to_print))
for i in rows_to_print:
print(text[i])
Мне бы хотелось, чтобы комментарии имели правильное форматирование текста кода, потому что я думаю, что ответ @ 1_CR нуждается в большем количестве ухабов, и я хотел бы дополнить его ответ. Во всяком случае, он привел меня к следующей технике; он будет использовать cStringIO, если он доступен (НО ЗАМЕЧАНИЕ: cStringIO и StringIO не совпадают , потому что вы не можете создать подкласс cStringIO ... это встроенный ... но для основных операций синтаксис будет идентичным, так что вы можете сделать это ):
try:
import cStringIO
StringIO = cStringIO
except ImportError:
import StringIO
for line in StringIO.StringIO(variable_with_multiline_string):
pass
print line.strip()