Как объединить 2 List <T> и удалить из него дублирующиеся значения в C #


159

У меня есть два списка Список, который мне нужно объединить в третьем списке и удалить повторяющиеся значения из этих списков

Немного сложно объяснить, поэтому позвольте мне показать пример того, как выглядит код и что я хочу получить в результате, в примере я использую тип int, а не класс ResultAnalysisFileSql.

first_list = [1, 12, 12, 5]

second_list = [12, 5, 7, 9, 1]

Результат объединения двух списков должен привести к этому списку: result_list = [1, 12, 5, 7, 9]

Вы заметите, что у результата есть первый список, включающий два значения «12», а во second_list есть дополнительные значения 12, 1 и 5.

ResultAnalysisFileSql класс

[Serializable]
    public partial class ResultAnalysisFileSql
    {
        public string FileSql { get; set; }

        public string PathFileSql { get; set; }

        public List<ErrorAnalysisSql> Errors { get; set; }

        public List<WarningAnalysisSql> Warnings{ get; set; }

        public ResultAnalysisFileSql()
        {

        }

        public ResultAnalysisFileSql(string fileSql)
        {
            if (string.IsNullOrEmpty(fileSql)
                || fileSql.Trim().Length == 0)
            {
                throw new ArgumentNullException("fileSql", "fileSql is null");
            }

            if (!fileSql.EndsWith(Utility.ExtensionFicherosErrorYWarning))
            {
                throw new ArgumentOutOfRangeException("fileSql", "Ruta de fichero Sql no tiene extensión " + Utility.ExtensionFicherosErrorYWarning);
            }

            PathFileSql = fileSql;
            FileSql = ObtenerNombreFicheroSql(fileSql);
            Errors = new List<ErrorAnalysisSql>();
            Warnings= new List<WarningAnalysisSql>();
        }

        private string ObtenerNombreFicheroSql(string fileSql)
        {
            var f = Path.GetFileName(fileSql);
            return f.Substring(0, f.IndexOf(Utility.ExtensionFicherosErrorYWarning));
        }


        public override bool Equals(object obj)
        {
            if (obj == null)
                return false;
            if (!(obj is ResultAnalysisFileSql))
                return false;

            var t = obj as ResultAnalysisFileSql;
            return t.FileSql== this.FileSql
                && t.PathFileSql == this.PathFileSql
                && t.Errors.Count == this.Errors.Count
                && t.Warnings.Count == this.Warnings.Count;
        }


    }

Любой пример кода для объединения и удаления дубликатов?

Ответы:


288

Вы смотрели на Enumerable.Union

Этот метод исключает дубликаты из возвращаемого набора . Это отличается от метода Concat, который возвращает все элементы во входных последовательностях, включая дубликаты.

List<int> list1 = new List<int> { 1, 12, 12, 5};
List<int> list2 = new List<int> { 12, 5, 7, 9, 1 };
List<int> ulist = list1.Union(list2).ToList();

// ulist output : 1, 12, 5, 7, 9

6
@Dr TJ: Реализует ли ваш личный класс IEqualityComparer <T>? Если это так, вам нужно проверить методы GetHashCode и Equals. См. Раздел «Примечания» на сайте msdn.microsoft.com/en-us/library/bb341731.aspx .
Томас Наррос

1
Важно отметить, потому что я столкнулся с проблемами при использовании этого в 2 разных коллекциях: «Вы не можете объединить два разных типа, если один не наследует от другого» из stackoverflow.com/a/6884940/410937, что привело к cannot be inferred from the usageошибке.
atconway

30

почему не просто например

var newList = list1.Union(list2)/*.Distinct()*//*.ToList()*/;

о ... в соответствии с MSDN вы можете опустить.Distinct()

Этот метод исключает дубликаты из возвращаемого набора


25

Союз не имеет хороших показателей: в этой статье описать, как сравнить их вместе

var dict = list2.ToDictionary(p => p.Number);
foreach (var person in list1)
{
        dict[person.Number] = person;
}
var merged = dict.Values.ToList();

Слияние списков и LINQ: 4820 мс Слияние
словарей: 16 мс
HashSet и IEqualityComparer: 20 мс
LINQ Union и IEqualityComparer: 24 мс


1
Также еще одно преимущество использования словаря слияния -> у меня есть два списка, возвращающихся из данных БД. И мои данные имеют поле метки времени, которое отличается в двух списках данных. С объединением я получаю дубликаты из-за отличия метки времени. Но с помощью слияния я могу решить, какое уникальное поле я хочу рассмотреть в словаре. +1
JimSan

Может варьироваться в зависимости от скорости процессора, зависит от того, какой у вас процессор.
Асад Али

7
И в конце статьи говорится: «Я предпочитаю LINQ Union, потому что он очень четко сообщает о намерениях». ;) (кроме того, разница составляла всего 8 мс)
Джеймс Уилкинс

1
Для небольших списков, где разница незначительна, Unionполучается более чистый и читаемый код. Трата времени на гипероптимизацию кода, когда он не медленный, может повлечь за собой штраф за техническое обслуживание в будущем.
Elolos


11
    List<int> first_list = new List<int>() {
        1,
        12,
        12,
        5
    };

    List<int> second_list = new List<int>() {
        12,
        5,
        7,
        9,
        1
    };

    var result = first_list.Union(second_list);
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.