PostgreSQL unnest () с номером элемента


89

Когда у меня есть столбец с разделенными значениями, я могу использовать unnest()функцию:

myTable
id | elements
---+------------
1  |ab,cd,efg,hi
2  |jk,lm,no,pq
3  |rstuv,wxyz

select id, unnest(string_to_array(elements, ',')) AS elem
from myTable

id | elem
---+-----
1  | ab
1  | cd
1  | efg
1  | hi
2  | jk
...

Как я могу указать номера элементов? Т.е.:

id | elem | nr
---+------+---
1  | ab   | 1
1  | cd   | 2
1  | efg  | 3
1  | hi   | 4
2  | jk   | 1
...

Мне нужна исходная позиция каждого элемента в исходной строке. Я пробовал использовать оконные функции ( row_number()и rank()т. Д.), Но всегда получаю 1. Может потому, что они находятся в одной строке исходной таблицы?

Я знаю, что это плохой дизайн стола. Это не мое, я просто пытаюсь это исправить.

Ответы:


183

Postgres 9.4 или новее

Используется WITH ORDINALITYдля функций, возвращающих набор:

Когда функция в FROMпредложении имеет суффикс WITH ORDINALITY, bigintк выходным данным добавляется столбец, который начинается с 1 и увеличивается на 1 для каждой строки выходных данных функции. Это наиболее полезно в случае набора возвращающих функций, таких как unnest().

В сочетании с LATERALфункцией в pg 9.3+ и согласно этой теме на pgsql-hackers , вышеуказанный запрос теперь можно записать как:

SELECT t.id, a.elem, a.nr
FROM   tbl AS t
LEFT   JOIN LATERAL unnest(string_to_array(t.elements, ','))
                    WITH ORDINALITY AS a(elem, nr) ON TRUE;

LEFT JOIN ... ON TRUEсохраняет все строки в левой таблице, даже если табличное выражение справа не возвращает строк. Если это не вызывает беспокойства, вы можете использовать эту эквивалентную, менее подробную форму с неявным CROSS JOIN LATERAL:

SELECT t.id, a.elem, a.nr
FROM   tbl t, unnest(string_to_array(t.elements, ',')) WITH ORDINALITY a(elem, nr);

Или проще, если на основе фактического массива ( arrявляющегося столбцом массива):

SELECT t.id, a.elem, a.nr
FROM   tbl t, unnest(t.arr) WITH ORDINALITY a(elem, nr);

Или даже с минимальным синтаксисом:

SELECT id, a, ordinality
FROM   tbl, unnest(arr) WITH ORDINALITY a;

aавтоматически является псевдонимом таблицы и столбца. Имя по умолчанию для добавленного столбца порядковых номеров - ordinality. Но лучше (безопаснее, чище) добавлять явные псевдонимы столбцов и столбцы, соответствующие таблице.

Postgres 8.4 - 9.3

С row_number() OVER (PARTITION BY id ORDER BY elem)вы получите номер в соответствии с порядком сортировок, а не порядковый номером оригинальной порядковой позиции в строке.

Вы можете просто опустить ORDER BY:

SELECT *, row_number() OVER (PARTITION by id) AS nr
FROM  (SELECT id, regexp_split_to_table(elements, ',') AS elem FROM tbl) t;

Хотя это обычно работает, и я никогда не видел, чтобы он терпел неудачу в простых запросах, PostgreSQL ничего не утверждает относительно порядка строк без ORDER BY. Так получается из-за детали реализации.

Чтобы гарантировать порядковые номера элементов в строке, разделенной пробелами :

SELECT id, arr[nr] AS elem, nr
FROM  (
   SELECT *, generate_subscripts(arr, 1) AS nr
   FROM  (SELECT id, string_to_array(elements, ' ') AS arr FROM tbl) t
   ) sub;

Или проще, если на основе фактического массива :

SELECT id, arr[nr] AS elem, nr
FROM  (SELECT *, generate_subscripts(arr, 1) AS nr FROM tbl) t;

Связанный ответ на dba.SE:

Postgres 8.1 - 8.4

Ни одна из этих функций не доступны, но: RETURNS TABLE, generate_subscripts(), unnest(), array_length(). Но это работает:

CREATE FUNCTION f_unnest_ord(anyarray, OUT val anyelement, OUT ordinality integer)
  RETURNS SETOF record
  LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) + 1
 FROM   generate_series(array_lower($1,1), array_upper($1,1)) i';

Обратите внимание, в частности, что индекс массива может отличаться от порядковых позиций элементов. Рассмотрим эту демонстрацию с расширенной функцией :

CREATE FUNCTION f_unnest_ord_idx(anyarray, OUT val anyelement, OUT ordinality int, OUT idx int)
  RETURNS SETOF record
  LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) + 1, i
 FROM   generate_series(array_lower($1,1), array_upper($1,1)) i';

SELECT id, arr, (rec).*
FROM  (
   SELECT *, f_unnest_ord_idx(arr) AS rec
   FROM  (VALUES (1, '{a,b,c}'::text[])  --  short for: '[1:3]={a,b,c}'
               , (2, '[5:7]={a,b,c}')
               , (3, '[-9:-7]={a,b,c}')
      ) t(id, arr)
   ) sub;

 id |       arr       | val | ordinality | idx
----+-----------------+-----+------------+-----
  1 | {a,b,c}         | a   |          1 |   1
  1 | {a,b,c}         | b   |          2 |   2
  1 | {a,b,c}         | c   |          3 |   3
  2 | [5:7]={a,b,c}   | a   |          1 |   5
  2 | [5:7]={a,b,c}   | b   |          2 |   6
  2 | [5:7]={a,b,c}   | c   |          3 |   7
  3 | [-9:-7]={a,b,c} | a   |          1 |  -9
  3 | [-9:-7]={a,b,c} | b   |          2 |  -8
  3 | [-9:-7]={a,b,c} | c   |          3 |  -7

Сравните:


10
Этот ответ является одним из наиболее полных ответов в SO относительно PostgreSQL. Спасибо, Эрвин.
Александрос

Можем ли мы адаптировать приведенную ниже функцию unnest2 к реальному возврату таблицы (а не к поддельным строкам) в новых версиях pg?
Питер Краусс

@ erwin -randtetter, не могли бы вы рассказать, почему / если WITH ORDINALITYпредпочтительнее generate_subscripts()? Мне кажется, generate_subscripts()лучше, поскольку он показывает фактическое расположение элемента в массиве. Это полезно, например, при обновлении массива ... следует ли использовать WITH ORDINALITYвместо этого?
losthorse

1
@losthorse: я бы охарактеризовал это так: WITH ORDINALITYэто общее решение для получения номеров строк для любой функции возврата набора в запросе SQL. Это самый быстрый и надежный способ, и он также отлично работает для одномерных массивов на основе 1 (по умолчанию для массивов Postgres, учтите это ). Если вы работаете с любыми другими типами массивов (большинство людей этого не делают), и вам действительно нужно сохранить / работать с исходными индексами, тогда generate_subscripts()это правильный путь. Но unnest()для начала все сглаживает ...
Эрвин Брандштеттер

1
@ z0r_ Руководство: Table functions appearing in FROM can also be preceded by the key word LATERAL, but for functions the key word is optional; the function's arguments can contain references to columns provided by preceding FROM items in any case.
Эрвин Брандштеттер,

9

Пытаться:

select v.*, row_number() over (partition by id order by elem) rn from
(select
    id,
    unnest(string_to_array(elements, ',')) AS elem
 from myTable) v

6

Используйте функции генерации нижнего индекса .
http://www.postgresql.org/docs/current/static/functions-srf.html#FUNCTIONS-SRF-SUBSCRIPTS

Например:

SELECT 
  id
  , elements[i] AS elem
  , i AS nr
FROM
  ( SELECT 
      id
      , elements
      , generate_subscripts(elements, 1) AS i
    FROM
      ( SELECT
          id
          , string_to_array(elements, ',') AS elements
        FROM
          myTable
      ) AS foo
  ) bar
;

Проще:

SELECT
  id
  , unnest(elements) AS elem
  , generate_subscripts(elements, 1) AS nr
FROM
  ( SELECT
      id
      , string_to_array(elements, ',') AS elements
    FROM
      myTable
  ) AS foo
;

3

Если порядок элементов не важен, вы можете

select 
  id, elem, row_number() over (partition by id) as nr
from (
  select
      id,
      unnest(string_to_array(elements, ',')) AS elem
  from myTable
) a

0

unnest2() как упражнение

Более старые версии до pg v8.4 нуждаются в определяемом пользователем unnest(). Мы можем адаптировать эту старую функцию для возврата элементов с индексом:

CREATE FUNCTION unnest2(anyarray)
  RETURNS setof record  AS
$BODY$
  SELECT $1[i], i
  FROM   generate_series(array_lower($1,1),
                         array_upper($1,1)) i;
$BODY$ LANGUAGE sql IMMUTABLE;

2
Это не работало бы до pg v8.4, потому что его RETURNS TABLEеще нет. Я добавил к своему ответу главу, в которой обсуждает решение.
Эрвин Брандштеттер,

1
@ErwinBrandstetter, ваши ответы очень поучительны, и вы полируете текст четырехлетней давности (!) ... Вы пишете книгу PostgreSQL, используя свои тексты SO? :-)
Питер Краусс

Привет всем, это Wiki, можно редактировать (!) ... Но ладно, я исправился setof record.
Питер Краусс
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.