В чем разница между функциями RANK () и DENSE_RANK () в Oracle?


150

В чем разница между функциями RANK()и DENSE_RANK()функциями? Как узнать n-ую зарплату в следующей emptblтаблице?

DEPTNO  EMPNAME    SAL
------------------------------
10       rrr    10000.00
11       nnn    20000.00
11       mmm    5000.00
12       kkk    30000.00
10       fff    40000.00
10       ddd    40000.00
10       bbb    50000.00
10       ccc    50000.00

Если в таблице есть данные nulls, что будет, если я захочу узнать nthзарплату?

Ответы:


242

RANK дает вам рейтинг в пределах вашего заказанного раздела. Галстукам присваивается тот же ранг, а следующий ранг (ы) пропускается. Таким образом, если у вас есть 3 предмета на ранге 2, следующий перечисленный ранг получит 5 баллов.

DENSE_RANK снова дает вам рейтинг в пределах вашего заказанного раздела, но ранги являются последовательными. Ранги не пропускаются, если есть ранги с несколькими предметами.

Что касается нулей, то это зависит от предложения ORDER BY. Вот простой тестовый скрипт, с которым вы можете поиграть, чтобы увидеть, что происходит:

with q as (
select 10 deptno, 'rrr' empname, 10000.00 sal from dual union all
select 11, 'nnn', 20000.00 from dual union all
select 11, 'mmm', 5000.00 from dual union all
select 12, 'kkk', 30000 from dual union all
select 10, 'fff', 40000 from dual union all
select 10, 'ddd', 40000 from dual union all
select 10, 'bbb', 50000 from dual union all
select 10, 'xxx', null from dual union all
select 10, 'ccc', 50000 from dual)
select empname, deptno, sal
     , rank() over (partition by deptno order by sal nulls first) r
     , dense_rank() over (partition by deptno order by sal nulls first) dr1
     , dense_rank() over (partition by deptno order by sal nulls last) dr2
 from q; 

EMP     DEPTNO        SAL          R        DR1        DR2
--- ---------- ---------- ---------- ---------- ----------
xxx         10                     1          1          4
rrr         10      10000          2          2          1
fff         10      40000          3          3          2
ddd         10      40000          3          3          2
ccc         10      50000          5          4          3
bbb         10      50000          5          4          3
mmm         11       5000          1          1          1
nnn         11      20000          2          2          2
kkk         12      30000          1          1          1

9 rows selected.

Вот ссылка на хорошее объяснение и несколько примеров.


14
очень хорошая идея использовать select union all из dual для генерации выборочных данных без создания какой-либо таблицы
Жан-Кристоф Бланшар

@ Jean-ChristopheBlanchard, хотя вы могли бы так же легко использовать valuesпредложение.
Подстановочный

1
@Wildcard В PG, да. В Oracle нет . По крайней мере, не на 11. Я не сталкивался с 12 в продукт.
jpmc26

Удалить from dualдля генерации этих данных в Redshift
Gaurav

4
Иван, RANK дает мне представление о том, где я по отношению ко всем, кто меня опережает. DENSE_RANK говорит мне абсолютный ранг. У меня может быть вторая самая высокая зарплата, но впереди меня может быть 100 человек. Какой из них лучше, зависит от вопроса, на который я отвечаю.
DCookie

93

Эта статья здесь хорошо объясняет это. По сути, вы можете посмотреть на это так:

CREATE TABLE t AS
SELECT 'a' v FROM dual UNION ALL
SELECT 'a'   FROM dual UNION ALL
SELECT 'a'   FROM dual UNION ALL
SELECT 'b'   FROM dual UNION ALL
SELECT 'c'   FROM dual UNION ALL
SELECT 'c'   FROM dual UNION ALL
SELECT 'd'   FROM dual UNION ALL
SELECT 'e'   FROM dual;

SELECT
  v,
  ROW_NUMBER() OVER (ORDER BY v) row_number,
  RANK()       OVER (ORDER BY v) rank,
  DENSE_RANK() OVER (ORDER BY v) dense_rank
FROM t
ORDER BY v;

Выше приведут:

+---+------------+------+------------+
| V | ROW_NUMBER | RANK | DENSE_RANK |
+---+------------+------+------------+
| a |          1 |    1 |          1 |
| a |          2 |    1 |          1 |
| a |          3 |    1 |          1 |
| b |          4 |    4 |          2 |
| c |          5 |    5 |          3 |
| c |          6 |    5 |          3 |
| d |          7 |    7 |          4 |
| e |          8 |    8 |          5 |
+---+------------+------+------------+

В словах

  • ROW_NUMBER() присваивает уникальное значение каждой строке
  • RANK() приписывает тот же номер строки к тому же значению, оставляя «дыры»
  • DENSE_RANK() приписывает тот же номер строки к тому же значению, не оставляя "дырок"

Ошибка: ошибка SQL: ORA-00923: ключевое слово FROM не найдено там, где ожидается
zloctb

9
SELECT empno,
       deptno,
       sal,
       RANK() OVER (PARTITION BY deptno ORDER BY sal) "rank"
FROM   emp;

     EMPNO     DEPTNO        SAL       rank
---------- ---------- ---------- ----------
      7934         10       1300          1
      7782         10       2450          2
      7839         10       5000          3
      7369         20        800          1
      7876         20       1100          2
      7566         20       2975          3
      7788         20       3000          4
      7902         20       3000          4
      7900         30        950          1
      7654         30       1250          2
      7521         30       1250          2
      7844         30       1500          4
      7499         30       1600          5
      7698         30       2850          6


SELECT empno,
       deptno,
       sal,
       DENSE_RANK() OVER (PARTITION BY deptno ORDER BY sal) "rank"
FROM   emp;

     EMPNO     DEPTNO        SAL       rank
---------- ---------- ---------- ----------
      7934         10       1300          1
      7782         10       2450          2
      7839         10       5000          3
      7369         20        800          1
      7876         20       1100          2
      7566         20       2975          3
      7788         20       3000          4
      7902         20       3000          4
      7900         30        950          1
      7654         30       1250          2
      7521         30       1250          2
      7844         30       1500          3
      7499         30       1600          4
      7698         30       2850          5

8

rank () : используется для ранжирования записи в группе строк.

dens_rank () : функция DENSE_RANK действует как функция RANK, за исключением того, что она назначает последовательные ранги.

Запрос -

select 
    ENAME,SAL,RANK() over (order by SAL) RANK
from 
    EMP;

Вывод -

+--------+------+------+
| ENAME  | SAL  | RANK |
+--------+------+------+
| SMITH  |  800 |    1 |
| JAMES  |  950 |    2 |
| ADAMS  | 1100 |    3 |
| MARTIN | 1250 |    4 |
| WARD   | 1250 |    4 |
| TURNER | 1500 |    6 |
+--------+------+------+

Запрос -

select 
    ENAME,SAL,dense_rank() over (order by SAL) DEN_RANK
from 
    EMP;

Вывод -

+--------+------+-----------+
| ENAME  | SAL  |  DEN_RANK |
+--------+------+-----------+
| SMITH  |  800 |         1 |
| JAMES  |  950 |         2 |
| ADAMS  | 1100 |         3 |
| MARTIN | 1250 |         4 |
| WARD   | 1250 |         4 |
| TURNER | 1500 |         5 |
+--------+------+-----------+

2
select empno
       ,salary
       ,row_number() over(order by salary desc) as Serial
       ,Rank() over(order by salary desc) as rank
       ,dense_rank() over(order by salary desc) as denseRank
from emp ;

Row_number() -> Используется для генерации серийного номера

Dense_rank() даст непрерывный ранг, но ранг будет пропускать ранг в случае столкновения ранга.


2

Единственная разница между функциями RANK () и DENSE_RANK () заключается в тех случаях, когда есть «связь»; то есть в случаях, когда несколько значений в наборе имеют одинаковое ранжирование. В таких случаях RANK () назначает непоследовательные «ранги» значениям в наборе (что приводит к разрывам между целочисленными значениями ранжирования при наличии связи), тогда как DENSE_RANK () назначает последовательные ранги значениям в установить (таким образом, не будет пробелов между целочисленными значениями ранжирования в случае ничьей).

Например, рассмотрим набор {25, 25, 50, 75, 75, 100}. Для такого набора RANK () вернет {1, 1, 3, 4, 4, 6} (обратите внимание, что значения 2 и 5 пропущены), тогда как DENSE_RANK () вернет {1,1,2,3, 3,4}.


1

Функция SQL Rank () генерирует ранг данных в пределах упорядоченного набора значений, но следующим рангом после предыдущего ранга является row_number этой конкретной строки. С другой стороны, функция SQL Dense_Rank () генерирует следующее число вместо генерирования row_number. Ниже приведен пример SQL, который пояснит концепцию:

Select ROW_NUMBER() over (order by Salary) as RowNum, Salary, 
RANK() over (order by Salary) as Rnk, 
DENSE_RANK() over (order by Salary) as DenseRnk from (
Select 1000 as Salary union all
Select 1000 as Salary union all
Select 1000 as Salary union all
Select 2000 as Salary union all
Select 3000 as Salary union all
Select 3000 as Salary union all
Select 8000 as Salary union all
Select 9000 as Salary) A

Будет сгенерирован следующий вывод:

----------------------------
RowNum  Salary  Rnk DenseRnk
----------------------------
1       1000    1   1
2       1000    1   1
3       1000    1   1
4       2000    4   2
5       3000    5   3
6       3000    5   3
7       8000    7   4
8       9000    8   5

0

Ранг и Плотный ранг дают ранг в разделенном наборе данных.

Rank (): он не дает вам последовательных целых чисел.

Dense_rank (): он дает вам последовательные целые числа.

введите описание изображения здесь

На приведенном выше рисунке ранг 10008 zip равен 2 с помощью функции density_rank () и 24 с помощью функции rank (), так как он рассматривает row_number.


0

Rank(), Dense_rank(), row_number() Все они являются оконными функциями, что означает, что они сначала действуют как окна для некоторого упорядоченного набора ввода. Эти окна имеют разные функциональные возможности, связанные с ними в зависимости от требований. Вот выше 3:

row_number()

Начиная с того, row_number()как это составляет основу этих связанных оконных функций. row_number()как следует из названия, дает уникальный номер для набора строк, над которым он был применен. Аналогично присвоению серийного номера каждой строке.

Rank()

Подрывная деятельность row_number()может быть сказано как rank(). Rank () используется для присвоения одинакового серийного номера тем строкам упорядоченного набора, которые являются дубликатами, но при этом количество сохраняемых данных остается таким же, как и row_number()для всех после дубликатов rank (), что означает, например, снизу, например. Для данных 2 row_number () = rank () означает, что оба просто отличаются в форме дубликатов.

Data row_number() rank() dense_rank() 
    1         1                    1       1
    1         2                    1       1
    1         3                    1       1
    2         4                    4       2

В заключение,

Dense_rank () - это расширенная версия rank (), поскольку название предполагает ее плотность, поскольку, как видно из приведенного выше примера, rank () = dens_rank () для всех данных 1, но только для данных 2 они отличаются в той форме, в которой они поддерживает порядок ранга () из предыдущего ранга (), а не фактических данных


0

Единственная разница между функциями RANK () и DENSE_RANK () заключается в тех случаях, когда есть «связь»; то есть в случаях, когда несколько значений в наборе имеют одинаковое ранжирование. В таких случаях RANK () назначает непоследовательные «ранги» значениям в наборе (что приводит к разрывам между целочисленными значениями ранжирования при наличии связи), тогда как DENSE_RANK () назначает последовательные ранги значениям в установить (таким образом, не будет пробелов между целочисленными значениями ранжирования в случае ничьей).

Например, рассмотрим набор {30, 30, 50, 75, 75, 100}. Для такого набора RANK () вернет {1, 1, 3, 4, 4, 6} (обратите внимание, что значения 2 и 5 пропущены), тогда как DENSE_RANK () вернет {1,1,2,3, 3,4}.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.