Как отсортировать список / кортеж списков / кортежей по элементу по заданному индексу?


659

У меня есть некоторые данные в списке списков или в списке кортежей, например:

data = [[1,2,3], [4,5,6], [7,8,9]]
data = [(1,2,3), (4,5,6), (7,8,9)]

И я хочу отсортировать по 2-му элементу в подмножестве. Значение, сортировка по 2,5,8 , где 2находится с (1,2,3), 5от (4,5,6). Каков общий способ сделать это? Должен ли я хранить кортежи или списки в моем списке?


51
Что касается «Должен ли я хранить кортежи или списки в моем списке?», Эмпирическое правило - сделать вещи как можно более неизменными. Если вам не нужно изменять подсписки на месте, сделайте их кортежами.
Мэтью Флэшен

Ответы:


1117
sorted_by_second = sorted(data, key=lambda tup: tup[1])

или:

data.sort(key=lambda tup: tup[1])  # sorts in place

10
Любая идея, как отсортировать его больше к меньшему?
биллвиль

63
@billwild: помощь (отсортировано). обратное = true.
Стивен

34
@Stephen с помощью itemgetter быстрее и проще: key=itemgetter(1)и в начале файла:from operator import itemgetter
Joschua

3
@Cemre, как и во втором примере, sortвот метод Listобъекта Python, который получает лямбда-функцию в качестве keyпараметра. Вы можете назвать это как tup, или t, или как угодно, и это все равно будет работать. tupЗдесь указывается индекс кортежа списка, что 1означает, что сортировка будет выполняться по вторым значениям кортежей из исходного списка ( 2, 5, 8).
Нейротрансмиттер

1
Я слегка скептически отнесся к необоснованному утверждению, что «использование itemgetter быстрее и проще». Хотя я субъективно считаю, что интуитивный lambdaподход проще, чем интуитивный itemgetterкласс, itemgetter он действительно быстрее . Мне любопытно, почему это так. Мое грубое подозрение состоит в том, lambdaчто скрытая стоимость захвата всех локальных переменных в контекст замыкания влечет за собой скрытые издержки, в то время как itemgetterэкземпляр этого не делает. tl; dr: всегда используйте itemgetter, потому что скорость побеждает.
Сесил Карри

236
from operator import itemgetter
data.sort(key=itemgetter(1))

37
Это должен быть принятый ответ. Смотрите также Charlie «s разместил тайминги , демонстрируя itemgetterкласс для сортировки 126% быстрее , чем в среднем эквивалентной lambdaфункции.
Сесил Карри

9
Вы также можете сортировать по нескольким индексам иерархически, например,data.sort(key=itemgetter(3,1))
Michael Ohlrogge

58

Я просто хочу добавить к ответу Стивена, если вы хотите отсортировать массив от высокого к низкому, другой способ, кроме как в комментариях выше, просто добавить это в строку:

reverse = True

и результат будет следующим:

data.sort(key=lambda tup: tup[1], reverse=True)

48

Для сортировки по нескольким критериям, а именно, например, по второму и третьему элементам в кортеже,

data = [(1,2,3),(1,2,1),(1,1,4)]

и таким образом определить лямбду, которая возвращает кортеж, который описывает приоритет, например

sorted(data, key=lambda tup: (tup[1],tup[2]) )
[(1, 1, 4), (1, 2, 1), (1, 2, 3)]

28

Ответ Стивена - тот, который я бы использовал. Для полноты вот шаблон DSU (decorate-sort-undecorate) со списками:

decorated = [(tup[1], tup) for tup in data]
decorated.sort()
undecorated = [tup for second, tup in decorated]

Или, более кратко:

[b for a,b in sorted((tup[1], tup) for tup in data)]

Как отмечено в Python Sorting HowTo , это было ненужным со времен Python 2.4, когда стали доступны ключевые функции.


2
Так что этот ответ полезен для Python 2.3-? Есть ли какие-либо действительные варианты использования в более современных версиях Python, о которых вы могли бы рассказать немного подробнее? Если нет, то не беспокойтесь ... просто проходил мимо, видел это, и старый чучело чуть не лопнул. Во всяком случае, ура и спасибо за это вернуться в первые дни Python.
mechanical_meat

19

Чтобы отсортировать список кортежей (<word>, <count>), по countубыванию и wordпо алфавиту:

data = [
('betty', 1),
('bought', 1),
('a', 1),
('bit', 1),
('of', 1),
('butter', 2),
('but', 1),
('the', 1),
('was', 1),
('bitter', 1)]

Я использую этот метод:

sorted(data, key=lambda tup:(-tup[1], tup[0]))

и это дает мне результат:

[('butter', 2),
('a', 1),
('betty', 1),
('bit', 1),
('bitter', 1),
('bought', 1),
('but', 1),
('of', 1),
('the', 1),
('was', 1)]

1
что если tup [1] является строкой?
Эрик


9

itemgetter()несколько быстрее, чем lambda tup: tup[1], но увеличение является относительно скромным (около 10-25 процентов).

(Сессия IPython)

>>> from operator import itemgetter
>>> from numpy.random import randint
>>> values = randint(0, 9, 30000).reshape((10000,3))
>>> tpls = [tuple(values[i,:]) for i in range(len(values))]

>>> tpls[:5]    # display sample from list
[(1, 0, 0), 
 (8, 5, 5), 
 (5, 4, 0), 
 (5, 7, 7), 
 (4, 2, 1)]

>>> sorted(tpls[:5], key=itemgetter(1))    # example sort
[(1, 0, 0), 
 (4, 2, 1), 
 (5, 4, 0), 
 (8, 5, 5), 
 (5, 7, 7)]

>>> %timeit sorted(tpls, key=itemgetter(1))
100 loops, best of 3: 4.89 ms per loop

>>> %timeit sorted(tpls, key=lambda tup: tup[1])
100 loops, best of 3: 6.39 ms per loop

>>> %timeit sorted(tpls, key=(itemgetter(1,0)))
100 loops, best of 3: 16.1 ms per loop

>>> %timeit sorted(tpls, key=lambda tup: (tup[1], tup[0]))
100 loops, best of 3: 17.1 ms per loop

Пожалуйста, ознакомьтесь с решением для сортировки itemgetter для изменения обратных аргументов для нескольких столбцов здесь, затем вам нужно организовать сортировку в несколько шагов подряд: stackoverflow.com/questions/14466068/…
Lorenz

6

Ответ @Stephen к сути! Вот пример для лучшей визуализации,

Привет фанатам Ready Player One! знак равно

>>> gunters = [('2044-04-05', 'parzival'), ('2044-04-07', 'aech'), ('2044-04-06', 'art3mis')]
>>> gunters.sort(key=lambda tup: tup[0])
>>> print gunters
[('2044-04-05', 'parzival'), ('2044-04-06', 'art3mis'), ('2044-04-07', 'aech')]

keyэто функция, которая будет вызываться для преобразования элементов коллекции для сравнения .. как compareToметод в Java.

Параметр, передаваемый ключу, должен быть вызываемым. Здесь использование lambdaсоздает анонимную функцию (которая вызывается).
Синтаксис лямбды - это слово лямбда, за которым следует повторяемое имя, а затем отдельный блок кода.

Ниже приведен пример сортировки списка кортежей, который содержит информацию о времени определенного события и имени актера.

Мы сортируем этот список по времени возникновения события, которое является 0-м элементом кортежа.

Примечание - s.sort([cmp[, key[, reverse]]]) сортирует элементы s на месте


-5

Сортировать кортеж довольно просто:

tuple(sorted(t))
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.