В настоящее время я сравниваю два набора данных, которые содержат уникальные StoreKey/ProductKey
комбинации.
Первый набор данных имеет уникальные StoreKey/ProductKey
комбинации для продаж между началом января 2012 года и концом мая 2014 года (результат = 450 тыс. Строк). Второй набор данных имеет уникальные StoreKey/ProductKey
комбинации, продажи начинаются с июня 2014 года до сегодняшнего дня (результат = 190 тыс. Строк).
Я ищу, чтобы найти StoreKey/ProductKey
комбинации, которые во 2-м наборе, но не в 1-м наборе - то есть новые продукты, проданные с начала июня.
До сих пор я сбрасывал два набора данных во временные таблицы, создавал индексы для обеих таблиц по обоим ключам и использовал EXCEPT
инструкцию для поиска уникальных элементов.
Каков наиболее эффективный способ сравнения таких больших наборов данных? Есть ли более эффективный способ проведения такого большого сравнения?