Удалить повторяющиеся элементы из массива в Ruby


325

У меня есть массив Ruby, который содержит дубликаты элементов.

array = [1,2,2,1,4,4,5,6,7,8,5,6]

Как я могу удалить все повторяющиеся элементы из этого массива, сохранив при этом все уникальные элементы без использования циклов for и итерации?

Ответы:


722
array = array.uniq

uniq удаляет все повторяющиеся элементы и сохраняет все уникальные элементы в массиве.

Это одна из многих красот языка Ruby.


50
нет, уникальный! Метод вернет nil, если массив был еще уникальным. Например: a = [1,2,3,4] a.uniq -> [1,2,3,4] но a.uniq! -> ноль
дуйхоа

15
я бы на самом деле не рассматривал это как красоту языка ruby ​​... это просто красота стандартной библиотеки ruby? не поймите меня неправильно, в языке много прекрасного.
Джастин Л.

7
написать то же самое в Objective-C, Javascript и PHP. Тогда скажите нам, что Ruby не красивый язык!
Адам Уэйт

3
Это также работает для сложных типов: [{how: "are"}, {u:"doing"}, {how: "are"}].uniq => [{:how=>"are"}, {:u=>"doing"}]
Blaskovicz

5
о том, что @duykhoa говорит, uniq! метод возвращает ноль, но вы обычно не заботитесь о возврате, .uniq!он выполняет работу над самим объектом
carpinchosaurio

82

Вы можете вернуть перекресток.

a = [1,1,2,3]
a & a

Это также удалит дубликаты.


12
Функционально этот ответ правильный, но я думаю, что он заметно менее читабелен, чем просто использование uniq.
Фиона Т

21
Я просто выкладывал это здесь, чтобы каждый, кто посещает эту страницу, видел и другие способы сделать это, я не пытался сказать, что это лучше в любом случае.
Джаредмит

3
Это работает потому, что при использовании операций над множествами результирующий массив обрабатывается как набор, представляющий собой структуру данных, которая обычно не имеет повторяющихся значений. Использование a | a(union) сделало бы то же самое.
Цезарь

47

Вы можете удалить дубликаты элементов с помощью метода uniq:

array.uniq  # => [1, 2, 4, 5, 6, 7, 8]

Также полезно знать, что это uniqзанимает блок, поэтому, если у вас есть массив ключей:

["bucket1:file1", "bucket2:file1", "bucket3:file2", "bucket4:file2"]

и вы хотите узнать, что это за уникальные файлы, вы можете узнать это с помощью:

a.uniq { |f| f[/\d+$/] }.map { |p| p.split(':').last }

5
Я немного смущен этим. Блок используется, если вам нужна собственная функция сравнения - в вашем примере отправка uniqв этот массив без блока вернет то же значение, что и для вашего блока.
hdgarrood

18

Просто еще одна альтернатива, если кому-то все равно.

Вы также можете использовать to_setметод массива, который преобразует массив в набор, и по определению элементы набора являются уникальными.

[1,2,3,4,5,5,5,6].to_set => [1,2,3,4,5,6]

4
Если вы заботитесь о памяти, to_setвыделите 4 объекта, а uniqвыделите один.
Ян Климо

18

Если кто-то искал способ удалить все экземпляры повторяющихся значений, см. « Как эффективно извлечь повторяющиеся элементы в массиве Ruby? ».

a = [1, 2, 2, 3]
counts = Hash.new(0)
a.each { |v| counts[v] += 1 }
p counts.select { |v, count| count == 1 }.keys # [1, 3]

3
Или мог бы просто сделать a = [1, 2, 2, 3] a.find_all { |x| a.count(x) == 1 } # [1, 3]
Тим Райт

Связанный вопрос - это не то же самое; Он спрашивает, как найти дублированные значения и вернуть их. ОП хочет удалить дубликаты.
Жестянщик

0

Просто чтобы дать некоторое представление:

require 'fruity'
require 'set'

array = [1,2,2,1,4,4,5,6,7,8,5,6] * 1_000

def mithun_sasidharan(ary)
  ary.uniq
end

def jaredsmith(ary)
  ary & ary
end

def lri(ary)
  counts = Hash.new(0)
  ary.each { |v| counts[v] += 1 }
  counts.select { |v, count| count == 1 }.keys 
end

def finks(ary)
  ary.to_set
end

def santosh_mohanty(ary)
    result = ary.reject.with_index do |ele,index|
      res = (ary[index+1] ^ ele)
      res == 0
    end
end

SHORT_ARRAY = [1,1,2,2,3,1]
mithun_sasidharan(SHORT_ARRAY) # => [1, 2, 3]
jaredsmith(SHORT_ARRAY) # => [1, 2, 3]
lri(SHORT_ARRAY) # => [3]
finks(SHORT_ARRAY) # => #<Set: {1, 2, 3}>
santosh_mohanty(SHORT_ARRAY) # => [1, 2, 3, 1]

puts 'Ruby v%s' % RUBY_VERSION

compare do
  _mithun_sasidharan { mithun_sasidharan(array) }
  _jaredsmith { jaredsmith(array) }
  _lri { lri(array) }
  _finks { finks(array) }
  _santosh_mohanty { santosh_mohanty(array) }
end

Что, при запуске, приводит к:

# >> Ruby v2.7.1
# >> Running each test 16 times. Test will take about 2 seconds.
# >> _mithun_sasidharan is faster than _jaredsmith by 2x ± 0.1
# >> _jaredsmith is faster than _santosh_mohanty by 4x ± 0.1 (results differ: [1, 2, 4, 5, 6, 7, 8] vs [1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, ...
# >> _santosh_mohanty is similar to _lri (results differ: [1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, 7, 8, 5, 6, 1, 2, 1, 4, 5, 6, ...
# >> _lri is similar to _finks (results differ: [] vs #<Set: {1, 2, 4, 5, 6, 7, 8}>)

Примечание: эти результаты дали плохие результаты:

  • lri(SHORT_ARRAY) # => [3]
  • finks(SHORT_ARRAY) # => #<Set: {1, 2, 3}>
  • santosh_mohanty(SHORT_ARRAY) # => [1, 2, 3, 1]

-4

Попробуйте использовать оператор XOR, не используя встроенные функции:

a = [3,2,3,2,3,5,6,7].sort!

result = a.reject.with_index do |ele,index|
  res = (a[index+1] ^ ele)
  res == 0
end

print result

Со встроенными функциями:

a = [3,2,3,2,3,5,6,7]

a.uniq

2
Я не голосовал против и почти ничего не знаю о Ruby, но разве это не .sort!встроенная функция?
Каролус
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.