Как использовать пользовательскую функцию сравнения в Python 3?


99

В Python 2.x я мог передать пользовательскую функцию функциям sorted и .sort.

>>> x=['kar','htar','har','ar']
>>>
>>> sorted(x)
['ar', 'har', 'htar', 'kar']
>>> 
>>> sorted(x,cmp=customsort)
['kar', 'htar', 'har', 'ar']

Потому что, на Моем языке, коннекторы идут с таким порядком

"k","kh",....,"ht",..."h",...,"a"

Но в Python 3.x похоже, что я не мог передать cmpключевое слово

>>> sorted(x,cmp=customsort)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'cmp' is an invalid keyword argument for this function

Есть ли альтернативы, или я должен написать свою собственную отсортированную функцию?

Примечание: я упростил, используя «k», «kh» и т. Д. Фактические символы - это юникоды и даже более сложные, иногда гласные идут до и после компонентов, я сделал специальную функцию сравнения, так что эта часть в порядке. Только проблема в том, что я не смог передать свою пользовательскую функцию сравнения в sorted или .sort


ты только что пробовал sorted(x)?
SilentGhost

@SilentGhost, Чтобы убедиться, я просто попробовал еще раз, конечно, не работает, потому что мой исходный язык не входит в список локалей, поддерживаемых операционными системами для сортировки.
ВЫ

1
Вы можете обернуть свой cmp как ключевую функцию. Найдите cmp_to_key на сайте HowToSorting.
Фрэнк

Ответы:


50

Используйте keyаргумент (и следуйте рецепту того, как преобразовать старую cmpфункцию в keyфункцию).

functoolsимеет функцию, cmp_to_keyупомянутую на docs.python.org/3.6/library/functools.html#functools.cmp_to_key


+1, похоже, рецепт дает мне обходной путь, но я думаю, что я потеряю некоторую производительность, передав все операторы сравнения < > = среднему человеку, поскольку моя исходная настраиваемая сортировка написана на C, она имела скорость примерно в 1/2 раза выше сортировка по умолчанию.
ВЫ

2
(Только что посмотрел ваш профиль) Ваша компания блокирует доступ к Google и StackOverflow? Насколько они могут стать глупыми? Но по поводу вашего ответа: меня бы интересовало реальное снижение производительности. Сможете ли вы timeitэто?
Тим Пицкер

4
Я провел несколько тестов, похоже, примерно в 4 раза медленнее, чем передача пользовательской функции сравнения C.
ВЫ

2
Что, если мне нужны как функция ключа, так и функция cmp? Я хочу отсортировать список словарей по индивидуальному ключу в каждом словаре. sorted_rows = sorted(rows, key=itemgetter('name'), cmp=locale.strxfrm)выдает TypeError: 'cmp' является недопустимым аргументом ключевого слова для этой функции в Python 3.2 :(
bitek

4
functools имеет функцию cmp_to_key в стандартной библиотеке: docs.python.org/3.6/library/functools.html
Мартин Фиксман,

59

Используйте keyключевое слово и functools.cmp_to_key для преобразования вашей функции сравнения:

sorted(x, key=functools.cmp_to_key(customsort))

17

Вместо customort () вам нужна функция, которая переводит каждое слово в то, что Python уже умеет сортировать. Например, вы можете перевести каждое слово в список чисел, где каждое число означает место каждой буквы в вашем алфавите. Что-то вроде этого:

my_alphabet = ['a', 'b', 'c']

def custom_key(word):
   numbers = []
   for letter in word:
      numbers.append(my_alphabet.index(letter))
   return numbers

x=['cbaba', 'ababa', 'bbaa']
x.sort(key=custom_key)

Поскольку ваш язык включает в себя многосимвольные буквы, ваша функция custom_key, очевидно, должна быть более сложной. Это должно дать вам общее представление.


Спасибо +1, я так думаю. но поскольку в моем языке нет разделителей слов и стандартных правил латинизации, я думаю, что потребуется время для исследования.
ВЫ

9

Полный пример лямбда-выражения cmp_to_key на python3:

from functools import cmp_to_key

nums = [28, 50, 17, 12, 121]
nums.sort(key=cmp_to_key(lambda x, y: 1 if str(x)+str(y) < str(y)+str(x) else -1))

сравните с обычной сортировкой объектов:

class NumStr:
    def __init__(self, v):
        self.v = v
    def __lt__(self, other):
        return self.v + other.v < other.v + self.v


A = [NumStr("12"), NumStr("121")]
A.sort()
print(A[0].v, A[1].v)

A = [obj.v for obj in A]
print(A)

4

Не знаю, поможет ли это, но вы можете проверить localeмодуль. Похоже, вы можете установить языковой стандарт на свой язык и использовать его locale.strcollдля сравнения строк, используя правила сортировки вашего языка.


Это верно для популярных языков, но мой язык не полностью поддерживается операционными системами, ICU и unicode.org, так что это не вопрос, но +1 за хорошее предложение.
ВЫ

-2

keyВместо этого используйте аргумент. Он принимает функцию, которая принимает обрабатываемое значение и возвращает одно значение, дающее ключ для использования для сортировки.

sorted(x, key=somekeyfunc)

3
key принимает только одну функцию параметра, cmp имеет 2 параметра, у них разное поведение. и я только что протестировал, получил ошибку, потому что ключевое слово передаёт только один параметрTypeError: customsort() takes exactly 2 positional arguments (1 given)
ВЫ
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.