ВЫБЕРИТЕ DISTINCT на одном столбце


258

Используя SQL Server, у меня есть ...

ID  SKU     PRODUCT
=======================
1   FOO-23  Orange
2   BAR-23  Orange
3   FOO-24  Apple
4   FOO-25  Orange

я хочу

1   FOO-23  Orange
3   FOO-24  Apple

Этот запрос не доставляет меня туда. Как выбрать SELECT DISTINCT только для одного столбца?

SELECT 
[ID],[SKU],[PRODUCT]
FROM [TestData] 
WHERE ([PRODUCT] = 
(SELECT DISTINCT [PRODUCT] FROM [TestData] WHERE ([SKU] LIKE 'FOO-%')) 
ORDER BY [ID]

1
Можем ли мы предположить, что вас не волнует суффикс в данных столбца SKU? IE, вы заботитесь только о "FOO-", а не о "FOO-xx"
Кейн

3
Какова ваша логика выбора ID = 1, SKU = FOO-23 среди других значений? Легко создать запрос, который отвечает конкретно для ID = 1, но не дает результатов в общем случае
gbn

4
gbn - это слишком упрощенный пример (очевидно). То, что я пытаюсь показать, это один пример, который удовлетворяет обоим критериям. Там нет (и не должно быть) логика, в которой он выбран.
mmcglynn

Ответы:


323

Предполагая, что вы используете SQL Server 2005 или более позднюю версию, вы можете использовать CTE с ROW_NUMBER ():

SELECT  *
FROM    (SELECT ID, SKU, Product,
                ROW_NUMBER() OVER (PARTITION BY PRODUCT ORDER BY ID) AS RowNumber
         FROM   MyTable
         WHERE  SKU LIKE 'FOO%') AS a
WHERE   a.RowNumber = 1

37
Вы не используете CTE в своем запросе. Это просто производная таблица. Но вы правы, что могли бы использовать CTE здесь.
Марк Байерс

оставьте "КАК" для оракула -> ... ГДЕ SKU НРАВИТСЯ 'FOO%') a ГДЕ a.RowNumber = 1
Андре Нель

Это работает, хотя это не CTE (; С CTE ......). больше подзапроса с разделом внутри ...
user274294

это действительно полезный случай при любом различном дублировании, спасибо
ASLIM

42

Простейшим решением будет использование подзапроса для поиска минимального идентификатора, соответствующего вашему запросу. В подзапросе вы используете GROUP BYвместо DISTINCT:

SELECT * FROM [TestData] WHERE [ID] IN (
   SELECT MIN([ID]) FROM [TestData]
   WHERE [SKU] LIKE 'FOO-%'
   GROUP BY [PRODUCT]
)

13

попробуй это:

SELECT 
    t.*
    FROM TestData t
        INNER JOIN (SELECT
                        MIN(ID) as MinID
                        FROM TestData
                        WHERE SKU LIKE 'FOO-%'
                   ) dt ON t.ID=dt.MinID

РЕДАКТИРОВАТЬ, как
только ОП исправил свой вывод сэмпла (раньше у него была только ОДНА строка результатов, теперь все показано), это правильный запрос:

declare @TestData table (ID int, sku char(6), product varchar(15))
insert into @TestData values (1 ,  'FOO-23'      ,'Orange')
insert into @TestData values (2 ,  'BAR-23'      ,'Orange')
insert into @TestData values (3 ,  'FOO-24'      ,'Apple')
insert into @TestData values (4 ,  'FOO-25'      ,'Orange')

--basically the same as @Aaron Alton's answer:
SELECT
    dt.ID, dt.SKU, dt.Product
    FROM (SELECT
              ID, SKU, Product, ROW_NUMBER() OVER (PARTITION BY PRODUCT ORDER BY ID) AS RowID
              FROM @TestData
              WHERE  SKU LIKE 'FOO-%'
         ) AS dt
    WHERE dt.RowID=1
    ORDER BY dt.ID

8
SELECT min (id) AS 'ID', min(sku) AS 'SKU', Product
    FROM TestData
    WHERE sku LIKE 'FOO%' -- If you want only the sku that matchs with FOO%
    GROUP BY product 
    ORDER BY 'ID'

3
Я собирался +1 к этому, потому что я думаю, что GROUP BY - правильный путь, но минимальный ID и минимальный SKU могут не совпадать с одной и той же записью. Трудно определить, какой правильный ID и SKU следует указывать для данного ПРОДУКТА.
Карл Манастер

8

Я знаю, что это было задано более 6 лет назад, но знание все еще знание. Это решение отличается от всего вышеперечисленного, так как мне приходилось запускать его под SQL Server 2000:

DECLARE @TestData TABLE([ID] int, [SKU] char(6), [Product] varchar(15))
INSERT INTO @TestData values (1 ,'FOO-23', 'Orange')
INSERT INTO @TestData values (2 ,'BAR-23', 'Orange')
INSERT INTO @TestData values (3 ,'FOO-24', 'Apple')
INSERT INTO @TestData values (4 ,'FOO-25', 'Orange')

SELECT DISTINCT  [ID] = ( SELECT TOP 1 [ID]  FROM @TestData Y WHERE Y.[Product] = X.[Product])
                ,[SKU]= ( SELECT TOP 1 [SKU] FROM @TestData Y WHERE Y.[Product] = X.[Product])
                ,[PRODUCT] 
            FROM @TestData X  

0

Вот версия, в основном та же, что и у пары других ответов, но которую вы можете скопировать в свою среду SQL Server Management Studio для тестирования (и без создания нежелательных таблиц), благодаря некоторым встроенным значениям.

WITH [TestData]([ID],[SKU],[PRODUCT]) AS
(
    SELECT *
    FROM (
        VALUES
        (1,   'FOO-23',  'Orange'),
        (2,   'BAR-23',  'Orange'),
        (3,   'FOO-24',  'Apple'),
        (4,   'FOO-25',  'Orange')
    )
    AS [TestData]([ID],[SKU],[PRODUCT])
)

SELECT * FROM [TestData] WHERE [ID] IN 
(
    SELECT MIN([ID]) 
    FROM [TestData] 
    GROUP BY [PRODUCT]
)

результат

ID  SKU     PRODUCT
1   FOO-23  Orange
3   FOO-24  Apple

Я проигнорировал следующее ...

WHERE ([SKU] LIKE 'FOO-%')

так как это единственная часть авторов ошибочного кода, а не часть вопроса. Это вряд ли будет полезно для людей, которые ищут здесь.


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.