Замените каждую заглавную букву «L» в данном тексте на пустое место и букву «L». Мы можем сделать это, используя понимание списка, или мы можем определить функцию для этого следующим образом.
s = 'TheLongANDWindingRoad ABC A123B45'
''.join([char if (char.islower() or not char.isalpha()) else ' '+char for char in list(s)]).strip().split()
>>> ['The', 'Long', 'A', 'N', 'D', 'Winding', 'Road', 'A', 'B', 'C', 'A123', 'B45']
Если вы решите использовать функцию, вот как это сделать.
def splitAtUpperCase(text):
result = ""
for char in text:
if char.isupper():
result += " " + char
else:
result += char
return result.split()
В случае данного примера:
print(splitAtUpperCase('TheLongAndWindingRoad'))
>>>['The', 'Long', 'A', 'N', 'D', 'Winding', 'Road']
Но большую часть времени, когда мы разбиваем предложение на прописные буквы, обычно мы хотим сохранить сокращения, которые обычно представляют собой непрерывный поток прописных букв. Приведенный ниже код поможет.
def splitAtUpperCase(s):
for i in range(len(s)-1)[::-1]:
if s[i].isupper() and s[i+1].islower():
s = s[:i]+' '+s[i:]
if s[i].isupper() and s[i-1].islower():
s = s[:i]+' '+s[i:]
return s.split()
splitAtUpperCase('TheLongANDWindingRoad')
>>> ['The', 'Long', 'AND', 'Winding', 'Road']
Спасибо.