Нахождение k-го наименьшего элемента из заданной последовательности только с O (k) памятью O (n) времени

Предположим , что мы читаем последовательность чисел, один за другим. Как найти «й наименьший элемент только с помощью клеток памяти и в линейном времени ( ). Я думаю , что мы должны сохранить первые члены последовательности и когда получим «й член, удалить термин , который мы уверены , что она не может стать » й наименьший элемент , а затем сохранить «й член. Таким образом, у нас должен быть индикатор, который показывает этот непригодный термин на каждом шаге, и этот индикатор должен быстро обновляться на каждом шаге. Я начал с «Макс» $n$ $k$ $O(k)$ $O(n)$ $k$ $k+1$ $k$ $k+1$ ; но он не может обновить быстро; Значит , что если мы будем рассматривать не более , то в первом делеции мы пропускаем макс , и мы должны искать максимум в и его причины время , что это не линейная. Может быть , мы должны сохранить первые член последовательности более разумно. $O(k)$ $(n-k)\times O(k)$ $k$

Как мне решить эту проблему?

data-structures search-algorithms quicksort

— Shahab_HK
источник

Вы заинтересованы в сетевом алгоритме, или любой алгоритм подойдет?

— Юваль Филмус

Если

то вы можете сделать это, используя алгоритм статистики заказов. Если

то вы можете сделать это

памяти и

времени, используя любые сбалансированные по высоте деревья.

k = θ (n)

$k = \theta(n)$

k = o (n)

$k = o(n)$

O (k)

$O(k)$

O (n \log k)

$O(n\log k)$

— Shreesh

Это называется проблемой отбора en.wikipedia.org/wiki/Selection_algorithm

— xavierm02

Существуют линейные алгоритмы на месте, которые вы можете погуглить, но они несколько сложны.

— Юваль

@ xavierm02 это не проблема выбора. Потому что есть ограничение памяти.

— Shahab_HK

Ответы:

Создайте буфер размером . Прочитать в элементов из массива. Используйте алгоритм выбора линейного времени, чтобы разделить буфер так, чтобы наименьших элементов были первыми; это занимает время. Теперь прочитайте еще элементов из вашего массива в буфер, заменив самых больших элементов в буфере, разделите буфер, как и раньше, и повторите. $2k$ $2k$ $k$ $O(k)$ $k$ $k$

Для этого требуется времени и пространства. $O(k * n/k) = O(n)$ $O(k)$

— jbapple
источник

+1, это соответствует заданной асимптотике. При этом я не верю, что это быстрее, чем делать один алгоритм линейного выбора времени ... за исключением случаев, когда

- маленькая константа, тогда это дает интересную перспективу. Например, для

этот алгоритм производит функцию.

k

$k$

k = 1

$k = 1$ min

— orlp

Иногда алгоритм выбора линейного времени занимает слишком много места. Например, он не подходит для использования в контексте потоковой передачи или когда входной массив является неизменным.

— 17

Это действительные баллы.

— orlp

$O(k)$ $O(n \log k)$ $k$ $O(k)$ $O(\log k)$ $O(k + n\log k)$ $O(n \log k)$

$O(\log n)$ $O(n)$ $k$ $k$

$O(\log n)$ $O(k)$ $O(\log n)$ $2^{64}$ $\log 2^{64}= 64$ $k$ $n$

— orlp
источник

O (n \times \log min (k, n - k))

$O(n \times \log\min (k, n - k))$

@ xavierm02 = . Доказательство: худший случай для равен . Худший случай для - . Они одинаковы в пределах постоянного множителя, поэтому = .

O (m i n (k, n - k))

$O(min(k, n-k))$

O (k)

$O(k)$

k

$k$

n

$n$

m i n (k, n - k)

$min(k, n-k)$

\frac{n}{2}

$n \over 2$

O (m i n (k, n - k))

$O(min(k, n-k))$

O (k)

$O(k)$

— orlp

@ xavierm02 Тем не менее, это все еще хорошее ускорение :)

— orlp

u_{n, k} = k

$u_{n,k}=k$ - это но это не . Предположим, что это так. Тогда есть некоторые и некоторые так что для каждого мы имеем , что явно неверно (потому что мы можем взять Итак, .

O (k)

$O(k)$

O (min (k, n - k))

$O(\min (k, n-k))$

C

$C$

M

$M$

M \leq k \leq n

$M\le k\le n$

k \leq C (n - k)

$k\le C (n-k)$

n = k \to + \infty) .

$n=k \to +\infty).$

O (min (k, n - k)) ⊊ O (k)

$O(\min(k, n-k))\subsetneq O(k)$

— xavierm02

@ xavierm02 Я незнаком с твоей нотацией . Честно говоря, я вообще незнаком с многомерными обозначениями Big , особенно учитывая, что измерения не связаны между собой.

u_{n, k}

$u_{n, k}$

O

$O$

n, k

$n, k$

— orlp