Объединение пар элементов списка


82

Я знаю, что список можно объединить в одну длинную строку, например:

x = ['a', 'b', 'c', 'd']
print ''.join(x)

Очевидно, это выведет:

'abcd'

Однако я пытаюсь просто соединить первую и вторую строки в списке, затем присоединить третью и четвертую и так далее. Короче говоря, вместо этого из приведенного выше примера получить результат:

['ab', 'cd']

Есть какой-нибудь простой способ сделать это? Я, вероятно, также должен упомянуть, что длина строк в списке будет непредсказуемой, как и количество строк в списке, хотя количество строк всегда будет четным. Таким образом, исходный список может быть таким:

['abcd', 'e', 'fg', 'hijklmn', 'opq', 'r'] 

«Вероятно, я должен также упомянуть, что длина строк в списке будет непредсказуемой» - Так имеет ли значение длина? Т.е. вы просто хотите присоединиться к каждой паре элементов списка, или вы действительно хотите посмотреть на контент и присоединиться, пока результирующий элемент остается ниже некоторого специального ограничения длины?
тыкает

просто присоединяйтесь к каждой паре, я просто подумал, что незнание количества пар может быть проблемой
Джон

Ответы:


76

Вы можете использовать обозначение среза с шагами:

>>> x = "abcdefghijklm"
>>> x[0::2] #0. 2. 4...
'acegikm'
>>> x[1::2] #1. 3. 5 ..
'bdfhjl'
>>> [i+j for i,j in zip(x[::2], x[1::2])] # zip makes (0,1),(2,3) ...
['ab', 'cd', 'ef', 'gh', 'ij', 'kl']

Та же логика применима и к спискам. Длина строки не имеет значения, потому что вы просто складываете две строки вместе.


1
Несомненно, ответ kevpie намного лучше. В этом случае x[:::2]создается объект, x[1::2]создается еще один объект, эти создания, вероятно, основаны на вычислении индексов под капотом, и вызов функции с этими двумя объектами, переданными в качестве аргументов, необходим, прежде чем можно будет получить следующие пары элементов это должно быть объединено. В ответе kevpie просто создается один итератор, а затем итерация переходит от элемента к элементу нетронутого списка без необходимости заботиться об индексах, и это гораздо более питонично.
eyquem 07

@eyquem, используя itertools.isliceвместо [], удаляет промежуточные объекты. Но поскольку оба ответа работают при одинаковых условиях и возвращают одинаковые значения, они оба верны. И zip(i[::2], i[1::2])мне так мило, почему бы и нет? :)
utdemir 09

Это работает только с последовательностями , а ответ @kevpie является более общим и работает с любыми итерациями .
Кос,

37

Используйте итератор.

Понимание списка:

>>> si = iter(['abcd', 'e', 'fg', 'hijklmn', 'opq', 'r'])
>>> [c+next(si, '') for c in si]
['abcde', 'fghijklmn', 'opqr']
  • Очень эффективно для использования памяти.
  • Ровно один обход s

Выражение генератора:

>>> si = iter(['abcd', 'e', 'fg', 'hijklmn', 'opq', 'r'])
>>> pair_iter = (c+next(si, '') for c in si)
>>> pair_iter # can be used in a for loop
<generator object at 0x4ccaa8>
>>> list(pair_iter) 
['abcde', 'fghijklmn', 'opqr']
  • использовать как итератор

Используя карту, str .__ add__, iter

>>> si = iter(['abcd', 'e', 'fg', 'hijklmn', 'opq', 'r'])
>>> map(str.__add__, si, si)
['abcde', 'fghijklmn', 'opqr']

next (iterator [, default]) доступен начиная с Python 2.6


2
Безусловно, лучший ответ. См. Мой комментарий к ответу Утдемира.
eyquem

4

просто чтобы быть питоническим :-)

>>> x = ['a1sd','23df','aaa','ccc','rrrr', 'ssss', 'e', '']
>>> [x[i] + x[i+1] for i in range(0,len(x),2)]
['a1sd23df', 'aaaccc', 'rrrrssss', 'e']

в случае, если вы хотите быть в состоянии тревоги, если длина списка нечетная, вы можете попробовать:

[x[i] + x[i+1] if not len(x) %2 else 'odd index' for i in range(0,len(x),2)]

Удачи


2

Без построения временных списков:

>>> import itertools
>>> s = 'abcdefgh'
>>> si = iter(s)
>>> [''.join(each) for each in itertools.izip(si, si)]
['ab', 'cd', 'ef', 'gh']

или же:

>>> import itertools
>>> s = 'abcdefgh'
>>> si = iter(s)
>>> map(''.join, itertools.izip(si, si))
['ab', 'cd', 'ef', 'gh']

Хорошо, но, учитывая, что мой код в любом случае заставляет меня начинать с исходного списка, я думаю, что я выберу utdmr's .... спасибо, хотя
Джон


1

Что ж, я бы так и поступил, потому что я плохо разбираюсь в Регах ..

КОД

t = '1. eat, food\n\
7am\n\
2. brush, teeth\n\
8am\n\
3. crack, eggs\n\
1pm'.splitlines()

print [i+j for i,j in zip(t[::2],t[1::2])]

вывод:

['1. eat, food   7am', '2. brush, teeth   8am', '3. crack, eggs   1pm']  

Надеюсь это поможет :)

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.