У меня есть список переменных Python, который содержит строки. Есть ли функция Python, которая может преобразовать все строки за один проход в нижний регистр и наоборот, в верхний регистр?
У меня есть список переменных Python, который содержит строки. Есть ли функция Python, которая может преобразовать все строки за один проход в нижний регистр и наоборот, в верхний регистр?
Ответы:
Это можно сделать с помощью списочных представлений. Они в основном принимают форму [function-of-item for item in some-list]
. Например, чтобы создать новый список, в котором все элементы имеют нижний регистр (или верхний регистр во втором фрагменте), вы должны использовать:
>>> [x.lower() for x in ["A","B","C"]]
['a', 'b', 'c']
>>> [x.upper() for x in ["a","b","c"]]
['A', 'B', 'C']
Вы также можете использовать map
функцию:
>>> map(lambda x:x.lower(),["A","B","C"])
['a', 'b', 'c']
>>> map(lambda x:x.upper(),["a","b","c"])
['A', 'B', 'C']
list(map(lambda x:x.upper(),["a","b","c"]))
map(str.lower, ["A","B","C"])
Помимо легкости чтения (для многих людей), списочные представления также выигрывают в скоростной гонке:
$ python2.6 -m timeit '[x.lower() for x in ["A","B","C"]]'
1000000 loops, best of 3: 1.03 usec per loop
$ python2.6 -m timeit '[x.upper() for x in ["a","b","c"]]'
1000000 loops, best of 3: 1.04 usec per loop
$ python2.6 -m timeit 'map(str.lower,["A","B","C"])'
1000000 loops, best of 3: 1.44 usec per loop
$ python2.6 -m timeit 'map(str.upper,["a","b","c"])'
1000000 loops, best of 3: 1.44 usec per loop
$ python2.6 -m timeit 'map(lambda x:x.lower(),["A","B","C"])'
1000000 loops, best of 3: 1.87 usec per loop
$ python2.6 -m timeit 'map(lambda x:x.upper(),["a","b","c"])'
1000000 loops, best of 3: 1.87 usec per loop
map
выигрывает гонку, но ничего не делает :)
map(str.lower,["A","B","C"])
самый быстрый - это python3.7.5
>>> map(str.lower,["A","B","C"])
['a', 'b', 'c']
str.upper
чтобы преобразовать в верхний регистр
Понимание списка - это то, как я это делаю, это «Pythonic». Следующая расшифровка показывает, как преобразовать список в верхний регистр, а затем обратно в нижний:
pax@paxbox7:~$ python3
Python 3.5.2 (default, Nov 17 2016, 17:05:23)
[GCC 5.4.0 20160609] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> x = ["one", "two", "three"] ; x
['one', 'two', 'three']
>>> x = [element.upper() for element in x] ; x
['ONE', 'TWO', 'THREE']
>>> x = [element.lower() for element in x] ; x
['one', 'two', 'three']
list
в качестве имени переменной не лучший выбор :)
list
материала :)). Как вы думаете, откуда у вас недавно появилось ультрафиолетовое излучение? :)
Для этого образца понимание наиболее быстрое
$ python -m timeit -s 's = ["one", "two", "three"] * 1000' '[x.upper for x in s]' 1000 петель, лучшее из 3: 809 юзек на петлю $ python -m timeit -s 's = ["one", "two", "three"] * 1000' 'map (str.upper, s)' 1000 циклов, лучшее из 3: 1,12 мсек на цикл $ python -m timeit -s 's = ["one", "two", "three"] * 1000' 'map (lambda x: x.upper (), s)' 1000 циклов, лучшее из 3: 1,77 мсек на цикл
Решение:
>>> s = []
>>> p = ['This', 'That', 'There', 'is', 'apple']
>>> [s.append(i.lower()) if not i.islower() else s.append(i) for i in p]
>>> s
>>> ['this', 'that', 'there', 'is','apple']
Это решение создаст отдельный список, содержащий строчные элементы, независимо от их исходного регистра. Если исходный регистр является верхним, то он list s
будет содержать нижний регистр соответствующего элемента в list p
. Если исходный регистр элемента списка уже в нижнем регистре, list p
то list s
он сохранит регистр элемента и сохранит его в нижнем регистре. Теперь вы можете использовать list s
вместо list p
.
Если ваша цель - сопоставление с другой строкой путем преобразования за один проход, вы также можете использовать ее str.casefold()
.
Это полезно, когда у вас есть символы, отличные от ascii, и соответствующие версии ascii (например, maße vs masse). Несмотря на str.lower
то, что str.upper
в таких случаях str.casefold()
произойдет сбой, произойдет сбой . Это доступно в Python 3, и идея подробно обсуждается с ответом https://stackoverflow.com/a/31599276/4848659 .
>>>str="Hello World";
>>>print(str.lower());
hello world
>>>print(str.upper());
HELLO WOLRD
>>>print(str.casefold());
hello world
Вы можете попробовать использовать:
my_list = ['india', 'america', 'china', 'korea']
def capitalize_list(item):
return item.upper()
print(list(map(capitalize_list, my_list)))
Python3.6.8
In [1]: a = 'which option is the fastest'
In [2]: %%timeit
...: ''.join(a).upper()
762 ns ± 11.4 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
In [3]: %%timeit
...: map(lambda x:x.upper(), a)
209 ns ± 5.73 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
In [4]: %%timeit
...: map(str.upper, [i for i in a])
1.18 µs ± 11.3 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
In [5]: %%timeit
...: [i.upper() for i in a]
3.2 µs ± 64.1 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
Если вам нужна строка или список в качестве выходных данных, а не итератор (это для Python3), сравните ''.join(string).upper()
параметр с этим:
In [10]: %%timeit
...: [i for i in map(lambda x:x.upper(), a)]
4.32 µs ± 112 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
Если вы пытаетесь преобразовать всю строку в нижний регистр в списке, вы можете использовать pandas:
import pandas as pd
data = ['Study', 'Insights']
pd_d = list(pd.Series(data).str.lower())
вывод:
['study', 'insights']