Как найти «пробел» в счетчике работы с SQL?


106

Я хочу найти первый «пробел» в столбце счетчика в таблице SQL. Например, если есть значения 1,2,4 и 5, я бы хотел узнать 3.

Я, конечно, могу привести значения в порядок и просмотреть их вручную, но я хотел бы знать, есть ли способ сделать это в SQL.

Кроме того, это должен быть вполне стандартный SQL, работающий с разными СУБД.


В Sql server 2008 и новее вы можете использовать LAG(id, 1, null)функцию with OVER (ORDER BY id)clause.
ajeh

Ответы:


185

В MySQLи PostgreSQL:

SELECT  id + 1
FROM    mytable mo
WHERE   NOT EXISTS
        (
        SELECT  NULL
        FROM    mytable mi 
        WHERE   mi.id = mo.id + 1
        )
ORDER BY
        id
LIMIT 1

В SQL Server:

SELECT  TOP 1
        id + 1
FROM    mytable mo
WHERE   NOT EXISTS
        (
        SELECT  NULL
        FROM    mytable mi 
        WHERE   mi.id = mo.id + 1
        )
ORDER BY
        id

В Oracle:

SELECT  *
FROM    (
        SELECT  id + 1 AS gap
        FROM    mytable mo
        WHERE   NOT EXISTS
                (
                SELECT  NULL
                FROM    mytable mi 
                WHERE   mi.id = mo.id + 1
                )
        ORDER BY
                id
        )
WHERE   rownum = 1

ANSI (работает везде, наименее эффективно):

SELECT  MIN(id) + 1
FROM    mytable mo
WHERE   NOT EXISTS
        (
        SELECT  NULL
        FROM    mytable mi 
        WHERE   mi.id = mo.id + 1
        )

Системы, поддерживающие функции раздвижного окна:

SELECT  -- TOP 1
        -- Uncomment above for SQL Server 2012+
        previd
FROM    (
        SELECT  id,
                LAG(id) OVER (ORDER BY id) previd
        FROM    mytable
        ) q
WHERE   previd <> id - 1
ORDER BY
        id
-- LIMIT 1
-- Uncomment above for PostgreSQL

40
@vulkanino: пожалуйста, попросите их сохранить отступ. Также обратите внимание, что лицензия Creative Commons требует, чтобы вы татуировали мой ник и вопрос URL, хотя я думаю, что это может быть QR-код.
Quassnoi

4
Это здорово, но если бы я имел [1, 2, 11, 12], то нашел бы только это 3. Вместо этого я бы хотел найти 3-10 - в основном, начало и конец каждого пробела. Я понимаю, что мне, возможно, придется написать свой собственный скрипт python, который использует SQL (в моем случае MySql), но было бы неплохо, если бы SQL мог приблизить меня к тому, что я хочу (у меня есть таблица с 2 миллионами строк, в которых есть пробелы, поэтому мне нужно будет разрезать его на более мелкие части и запустить на нем некоторый SQL). Полагаю, я мог бы запустить один запрос, чтобы найти начало промежутка, затем другой, чтобы найти конец промежутка, и они «сортируют слияние» двух последовательностей.
Хэмиш Грубиджан

1
@HamishGrubijan: пожалуйста, опубликуйте это как другой вопрос
Quassnoi

2
@Malkocoglu: вы получите NULL, нет 0, если таблица пуста. Это верно для всех баз данных.
Quassnoi

5
это не поможет правильно найти начальные зазоры. если у вас 3,4,5,6,8. этот код сообщит 7, потому что у него нет 1, чтобы даже проверить. Так что, если вам не хватает стартовых номеров, вам придется это проверить.
ttomsen

12

Все ваши ответы работают нормально, если у вас есть первое значение id = 1, иначе этот пробел не будет обнаружен. Например, если значения идентификатора вашей таблицы 3,4,5, ваши запросы вернут 6.

Я сделал что-то вроде этого

SELECT MIN(ID+1) FROM (
    SELECT 0 AS ID UNION ALL 
    SELECT  
        MIN(ID + 1)
    FROM    
        TableX) AS T1
WHERE
    ID+1 NOT IN (SELECT ID FROM TableX) 

Это найдет первый пробел. Если у вас id 0, 2,3,4. Ответ - 1. Я искал ответ, чтобы найти самый большой разрыв. Скажем, последовательность равна 0,2,3,4, 100,101,102. Я хочу найти промежуток 4-99.
Кемин Чжоу

8

На самом деле нет чрезвычайно стандартного способа SQL для этого, но с некоторой формой ограничивающего предложения вы можете сделать

SELECT `table`.`num` + 1
FROM `table`
LEFT JOIN `table` AS `alt`
ON `alt`.`num` = `table`.`num` + 1
WHERE `alt`.`num` IS NULL
LIMIT 1

(MySQL, PostgreSQL)

или

SELECT TOP 1 `num` + 1
FROM `table`
LEFT JOIN `table` AS `alt`
ON `alt`.`num` = `table`.`num` + 1
WHERE `alt`.`num` IS NULL

(SQL Server)

или

SELECT `num` + 1
FROM `table`
LEFT JOIN `table` AS `alt`
ON `alt`.`num` = `table`.`num` + 1
WHERE `alt`.`num` IS NULL
AND ROWNUM = 1

(Оракул)


если есть диапазон пробелов, для вашего запроса postgres будет возвращена только первая строка в диапазоне.
Джон

Для меня это имеет наибольший смысл, использование объединения также позволит вам изменить значение TOP, чтобы показать больше результатов с разрывом.
AJ_

1
Спасибо, это работает очень хорошо, и если вы хотите увидеть все точки, где есть пробелы, вы можете удалить ограничение.
mekbib.awoke

8

Первое, что пришло мне в голову. Не уверен, что это вообще хорошая идея, но должно сработать. Предположим, что таблица tи столбец c:

SELECT t1.c+1 AS gap FROM t as t1 LEFT OUTER JOIN t as t2 ON (t1.c+1=t2.c) WHERE t2.c IS NULL ORDER BY gap ASC LIMIT 1

Изменить: это может быть быстрее (и короче!):

SELECT min(t1.c)+1 AS gap FROM t as t1 LEFT OUTER JOIN t as t2 ON (t1.c+1=t2.c) WHERE t2.c IS NULL


LEFT OUTER JOIN t ==> LEFT OUTER JOIN t2
Eamon Nerbonne

1
Нет-нет, Эамон, LEFT OUTER JOING t2вам потребуется t2таблица, которая является просто псевдонимом.
Михаил Крелин - хакер,

6

Это работает в SQL Server - не может протестировать его в других системах, но кажется стандартным ...

SELECT MIN(t1.ID)+1 FROM mytable t1 WHERE NOT EXISTS (SELECT ID FROM mytable WHERE ID = (t1.ID + 1))

Вы также можете добавить начальную точку к предложению where ...

SELECT MIN(t1.ID)+1 FROM mytable t1 WHERE NOT EXISTS (SELECT ID FROM mytable WHERE ID = (t1.ID + 1)) AND ID > 2000

Итак, если у вас были 2000, 2001, 2002 и 2005 годы, а 2003 и 2004 не существовали, он вернет 2003.


3

Следующее решение:

  • предоставляет тестовые данные;
  • внутренний запрос, который производит другие пробелы; и
  • он работает в SQL Server 2012.

Последовательно нумерует упорядоченные строки в предложении « with », а затем повторно использует результат дважды с внутренним соединением по номеру строки, но смещением на 1, чтобы сравнить предыдущую строку со строкой после, ища идентификаторы с пробелом больше 1. Больше, чем просили, но более широко применимо.

create table #ID ( id integer );

insert into #ID values (1),(2),    (4),(5),(6),(7),(8),    (12),(13),(14),(15);

with Source as (
    select
         row_number()over ( order by A.id ) as seq
        ,A.id                               as id
    from #ID as A WITH(NOLOCK)
)
Select top 1 gap_start from (
    Select 
         (J.id+1) as gap_start
        ,(K.id-1) as gap_end
    from       Source as J
    inner join Source as K
    on (J.seq+1) = K.seq
    where (J.id - (K.id-1)) <> 0
) as G

Внутренний запрос производит:

gap_start   gap_end

3           3

9           11

Внешний запрос производит:

gap_start

3

2

Внутреннее присоединение к представлению или последовательности, имеющей все возможные значения.

Нет стола? Сделайте стол. Я всегда держу пустышку только для этого.

create table artificial_range( 
  id int not null primary key auto_increment, 
  name varchar( 20 ) null ) ;

-- or whatever your database requires for an auto increment column

insert into artificial_range( name ) values ( null )
-- create one row.

insert into artificial_range( name ) select name from artificial_range;
-- you now have two rows

insert into artificial_range( name ) select name from artificial_range;
-- you now have four rows

insert into artificial_range( name ) select name from artificial_range;
-- you now have eight rows

--etc.

insert into artificial_range( name ) select name from artificial_range;
-- you now have 1024 rows, with ids 1-1024

Затем,

 select a.id from artificial_range a
 where not exists ( select * from your_table b
 where b.counter = a.id) ;

2

Для PostgreSQL

Пример использования рекурсивного запроса.

Это может быть полезно, если вы хотите найти пробел в определенном диапазоне (он будет работать, даже если таблица пуста, тогда как другие примеры не будут)

WITH    
    RECURSIVE a(id) AS (VALUES (1) UNION ALL SELECT id + 1 FROM a WHERE id < 100), -- range 1..100  
    b AS (SELECT id FROM my_table) -- your table ID list    
SELECT a.id -- find numbers from the range that do not exist in main table
FROM a
LEFT JOIN b ON b.id = a.id
WHERE b.id IS NULL
-- LIMIT 1 -- uncomment if only the first value is needed

1

Моя догадка:

SELECT MIN(p1.field) + 1 as gap
FROM table1 AS p1  
INNER JOIN table1 as p3 ON (p1.field = p3.field + 2)
LEFT OUTER JOIN table1 AS p2 ON (p1.field = p2.field + 1)
WHERE p2.field is null;

1

Это объясняет все, о чем говорилось до сих пор. Он включает 0 в качестве начальной точки, которая будет использоваться по умолчанию, если также не существует никаких значений. Я также добавил соответствующие места для других частей многозначного ключа. Это было проверено только на SQL Server.

select
    MIN(ID)
from (
    select
        0 ID
    union all
    select
        [YourIdColumn]+1
    from
        [YourTable]
    where
        --Filter the rest of your key--
    ) foo
left join
    [YourTable]
    on [YourIdColumn]=ID
    and --Filter the rest of your key--
where
    [YourIdColumn] is null

1

Я написал быстрый способ сделать это. Не уверен, что это самый эффективный вариант, но выполняет свою работу. Обратите внимание, что он не сообщает вам пробел, но сообщает идентификатор до и после пробела (имейте в виду, что пробел может быть несколькими значениями, например 1,2,4,7,11 и т. Д.)

Я использую sqlite в качестве примера

Если это ваша структура таблицы

create table sequential(id int not null, name varchar(10) null);

и это твои строки

id|name
1|one
2|two
4|four
5|five
9|nine

Запрос

select a.* from sequential a left join sequential b on a.id = b.id + 1 where b.id is null and a.id <> (select min(id) from sequential)
union
select a.* from sequential a left join sequential b on a.id = b.id - 1 where b.id is null and a.id <> (select max(id) from sequential);

https://gist.github.com/wkimeria/7787ffe84d1c54216f1b320996b17b7e


0
select min([ColumnName]) from [TableName]
where [ColumnName]-1 not in (select [ColumnName] from [TableName])
and [ColumnName] <> (select min([ColumnName]) from [TableName])

0

Вот стандартное решение SQL, которое работает на всех серверах баз данных без изменений:

select min(counter + 1) FIRST_GAP
    from my_table a
    where not exists (select 'x' from my_table b where b.counter = a.counter + 1)
        and a.counter <> (select max(c.counter) from my_table c);

Смотрите в действии для;


0

Он также работает для пустых таблиц или с отрицательными значениями. Только что протестировано в SQL Server 2012

 select min(n) from (
select  case when lead(i,1,0) over(order by i)>i+1 then i+1 else null end n from MyTable) w

0

Если вы используете Firebird 3, это будет наиболее элегантно и просто:

select RowID
  from (
    select `ID_Column`, Row_Number() over(order by `ID_Column`) as RowID
      from `Your_Table`
        order by `ID_Column`)
    where `ID_Column` <> RowID
    rows 1

0
            -- PUT THE TABLE NAME AND COLUMN NAME BELOW
            -- IN MY EXAMPLE, THE TABLE NAME IS = SHOW_GAPS AND COLUMN NAME IS = ID

            -- PUT THESE TWO VALUES AND EXECUTE THE QUERY

            DECLARE @TABLE_NAME VARCHAR(100) = 'SHOW_GAPS'
            DECLARE @COLUMN_NAME VARCHAR(100) = 'ID'


            DECLARE @SQL VARCHAR(MAX)
            SET @SQL = 
            'SELECT  TOP 1
                    '+@COLUMN_NAME+' + 1
            FROM    '+@TABLE_NAME+' mo
            WHERE   NOT EXISTS
                    (
                    SELECT  NULL
                    FROM    '+@TABLE_NAME+' mi 
                    WHERE   mi.'+@COLUMN_NAME+' = mo.'+@COLUMN_NAME+' + 1
                    )
            ORDER BY
                    '+@COLUMN_NAME

            -- SELECT @SQL

            DECLARE @MISSING_ID TABLE (ID INT)

            INSERT INTO @MISSING_ID
            EXEC (@SQL)

            --select * from @MISSING_ID

            declare @var_for_cursor int
            DECLARE @LOW INT
            DECLARE @HIGH INT
            DECLARE @FINAL_RANGE TABLE (LOWER_MISSING_RANGE INT, HIGHER_MISSING_RANGE INT)
            DECLARE IdentityGapCursor CURSOR FOR   
            select * from @MISSING_ID
            ORDER BY 1;  

            open IdentityGapCursor

            fetch next from IdentityGapCursor
            into @var_for_cursor

            WHILE @@FETCH_STATUS = 0  
            BEGIN
            SET @SQL = '
            DECLARE @LOW INT
            SELECT @LOW = MAX('+@COLUMN_NAME+') + 1 FROM '+@TABLE_NAME
                    +' WHERE '+@COLUMN_NAME+' < ' + cast( @var_for_cursor as VARCHAR(MAX))

            SET @SQL = @sql + '
            DECLARE @HIGH INT
            SELECT @HIGH = MIN('+@COLUMN_NAME+') - 1 FROM '+@TABLE_NAME
                    +' WHERE '+@COLUMN_NAME+' > ' + cast( @var_for_cursor as VARCHAR(MAX))

            SET @SQL = @sql + 'SELECT @LOW,@HIGH'

            INSERT INTO @FINAL_RANGE
             EXEC( @SQL)
            fetch next from IdentityGapCursor
            into @var_for_cursor
            END

            CLOSE IdentityGapCursor;  
            DEALLOCATE IdentityGapCursor;  

            SELECT ROW_NUMBER() OVER(ORDER BY LOWER_MISSING_RANGE) AS 'Gap Number',* FROM @FINAL_RANGE

0

Обнаружено, что большинство подходов выполняются очень и очень медленно mysql. Вот мое решение для mysql < 8.0. Проверено на 1 млн записей с разрывом в конце ~ 1 секунда до конца. Не уверен, подходит ли он другим вариантам SQL.

SELECT cardNumber - 1
FROM
    (SELECT @row_number := 0) as t,
    (
        SELECT (@row_number:=@row_number+1), cardNumber, cardNumber-@row_number AS diff
        FROM cards
        ORDER BY cardNumber
    ) as x
WHERE diff >= 1
LIMIT 0,1
Я предполагаю, что последовательность начинается с «1».

0

Если ваш счетчик начинается с 1 и вы хотите сгенерировать первый номер последовательности (1), когда он пуст, вот исправленный фрагмент кода из первого ответа, действительного для Oracle:

SELECT
  NVL(MIN(id + 1),1) AS gap
FROM
  mytable mo  
WHERE 1=1
  AND NOT EXISTS
      (
       SELECT  NULL
       FROM    mytable mi 
       WHERE   mi.id = mo.id + 1
      )
  AND EXISTS
     (
       SELECT  NULL
       FROM    mytable mi 
       WHERE   mi.id = 1
     )  

0
DECLARE @Table AS TABLE(
[Value] int
)

INSERT INTO @Table ([Value])
VALUES
 (1),(2),(4),(5),(6),(10),(20),(21),(22),(50),(51),(52),(53),(54),(55)
 --Gaps
 --Start    End     Size
 --3        3       1
 --7        9       3
 --11       19      9
 --23       49      27


SELECT [startTable].[Value]+1 [Start]
     ,[EndTable].[Value]-1 [End]
     ,([EndTable].[Value]-1) - ([startTable].[Value]) Size 
 FROM 
    (
SELECT [Value]
    ,ROW_NUMBER() OVER(PARTITION BY 1 ORDER BY [Value]) Record
FROM @Table
)AS startTable
JOIN 
(
SELECT [Value]
,ROW_NUMBER() OVER(PARTITION BY 1 ORDER BY [Value]) Record
FROM @Table
)AS EndTable
ON [EndTable].Record = [startTable].Record+1
WHERE [startTable].[Value]+1 <>[EndTable].[Value]

0

Если числа в столбце являются положительными целыми числами (начиная с 1), то вот как легко решить эту проблему. (при условии, что ID - это имя вашего столбца)

    SELECT TEMP.ID 
    FROM (SELECT ROW_NUMBER() OVER () AS NUM FROM 'TABLE-NAME') AS TEMP 
    WHERE ID NOT IN (SELECT ID FROM 'TABLE-NAME')
    ORDER BY 1 ASC LIMIT 1

он будет находить пробелы только до количества строк в 'TABLE-NAME', поскольку "SELECT ROW_NUMBER () OVER () AS NUM FROM 'TABLE-NAME'" даст идентификаторы только до количества строк
vijay shanker
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.