Есть ли алгоритм «сортировки», который возвращает случайную перестановку при использовании компаратора с переворотом?

Вдохновленный этим вопросом, в котором спрашивающий хочет знать, изменяется ли время выполнения, когда компаратор, используемый в стандартном алгоритме поиска, заменяется честным броском монеты, а также заметной неудачей Microsoft в написании генератора равномерной перестановки, мой вопрос, таким образом, таков: :

Существует ли алгоритм сортировки на основе сравнения, который в зависимости от нашей реализации компаратора будет:

возвращать элементы в отсортированном порядке при использовании истинного компаратора (то есть сравнение делает то, что мы ожидаем в стандартном алгоритме сортировки)
возвращать равномерно случайную перестановку элементов, когда компаратор заменяется честным подбрасыванием монеты (то есть возвращение x < y = trueс вероятностью 1/2, независимо от значений x и y)

Код для алгоритма сортировки должен быть таким же. Только код внутри «черного ящика» сравнения может быть изменен.

sorting randomized-algorithms permutations

— Джо
источник

Смотрите также этот вопрос .

— Рафаэль

Смотрите также следующий интересный вопрос: cstheory.stackexchange.com/questions/5321/… .

— Юваль Фильмус

Вы хотите, чтобы ваш случайный компаратор вел себя хорошо? Вот два возможных способа. (1) Как только компаратор решит, что

, то

всегда, а также

. (2) То же самое, но, кроме того, если компаратор решит, что

, то он фиксирует

(и

). В обоих случаях каждый необусловленный запрос все еще является полностью случайным.

x < y

$x<y$

x < y

$x<y$

y > x

$y>x$

x < y

$x<y$

y < z

$y<z$

x < z

$x<z$

z > x

$z>x$

— Юваль Фильмус

@YuvalFilmus Я хочу, по сути, то, что запрашивается в вашем связанном вопросе, за исключением того, что та же схема должна также сортироваться, если мы заменим случайный вентиль вентилем сравнения-обмена, который упорядочивает пару элементов.

— Джо

Смотрите здесь для хороших визуализаций.

— Рафаэль

Следующий детерминированный (без компаратора) алгоритм работает для входного кортежа : $(a_1,\dots,a_n)$

Выполните Fisher-Yates перемешайте с помощью компаратора с некоторой статической парой (скажем , ) в качестве подбрасывания монеты (делают выборку приемо-отказ). Если компаратор выдает в первый раз, используйте его инвертированным, чтобы избежать бесконечного цикла отклонения в детерминированном случае. $a_1 < a_2$ $1$
(необязательное ускорение: попробуйте одну пару раз, где - длина или ваш вход. Если какие-либо два выходных сигнала отличаются, возвращают перестановку, полученную в (1)) $n$ $n$
Сортируйте массив, используя сортировку слиянием.

При наличии детерминированного отношения порядка в качестве компаратора этот алгоритм сортирует массив за время поскольку перемешивание Фишера-Йейтса выполняется в с использованием максимального $\mathcal{O}(n \log n)$ $\mathcal{O}(n)$ случайная неслучайных «случайных битов» (например, вызовов вашего компаратора) ) в каждом шаге сортировка слиянием имеет одинаковую асимптотическую сложность. Результат (1) в этом случае совершенно бесполезен, но поскольку за ним следует реальная сортировка, это не вредит. $\mathcal{O}(\log n)$

Учитывая реальный бросок монеты, когда компаратор (1) переставляет массив с равной вероятностью для каждой перестановки, и если вам действительно нужно сделать (3) (вы пропустили (2) или (2) не смогли определить случайность), это не вред, потому что распределение его результата зависит только от порядка его ввода, который равномерно распределен среди всех перестановок из-за (1), поэтому результат всего алгоритма также равномерно распределен. Количество раз, которое каждая повторная выборка-приемка должна быть геометрически распределена (отклонение с вероятностью ) и, следовательно, имеет ожидаемое значение. Каждоеиспользует повторение в большинствебит, поэтому анализ выполнения почти такие жекакв детерминированном случае, но мы получить толькоожидаемое время работыот, с возможностью nontermination (только прекращает $< \frac{1}{2}$ $< 2$ $\log n$ $\mathcal{O}(n \log n)$ почти наверное ).

Как Джо отметил: Если вам не нравится , тест на первый бит в (1), делать (3) , затем (1) и использовать , который всегда , так как массив уже отсортирован в детерминированный случай. Кроме того, вы должны вычесть ваше случайное число из верхней границы диапазона в цикле, потому что верхняя граница для случайного числа дает идентичную перестановку. Но имейте в виду, что (2) тогда запрещено, потому что вы всегда должны делать случайные действия в случае выкупа. $a_n < a_1$ $0$

Вы даже можете использовать те же вызовы для вашего компаратора для (1) и (3), но затем доказать, что результат распределен равномерно, как минимум, намного сложнее, если вообще возможно.

Следующий алгоритм не имеет отдельных фаз для перемешивания и сортировки, но асимптотически медленнее. Это по сути вставка сортировки с бинарным поиском . Я буду использовать

для обозначения ввода, а

для обозначения результата после

раунда:

a = (a_{1}, \dots, a_{n})

$a=(a_1,\dots,a_n)$

b_{k} = (b_{k, 1}, \dots, b_{k, k})

$b_k=(b_{k,1},\dots,b_{k,k})$

k

$k$

Установите $b_{1,1} = a_1$
Если то и иначе и . В любом случае $a_2 < a_1$ $b_2 = (a_2,a_1)$ $(c,d):= (2,1)$ $b_2 = (a_1,a_2)$ $(c,d):= (1,2)$ всегда будет (т. е. false) для неслучайного компаратора. $a_d < a_c$ $0$
Чтобы получить при сначала получим . $b_{k}$ $k \geq 3$ $b_{k-1}$
Пусть и , т.е. - наименьшая степень не меньшая, чем . $l=\lceil log_2 k \rceil$ $k' = 2^l$ $k'$ $2$ $k$
Пусть . Для каждого пусть $i_0 = 0$ $j \in \{1,\dots,l\}$ $i_{j} = {\begin{cases} i_{j - 1} + 2^{l - j} & i_{j - 1} + 2^{l - j} > k - 1 \land a_{d} < a_{c} \\ i_{j - 1} & i_{j - 1} + 2^{l - j} > k - 1 \land \neg (a_{d} < a_{c}) \\ i_{j - 1} + 2^{l - j} & i_{j - 1} + 2^{l - j} \leq k - 1 \land b_{k - 1, i_{j - 1} + 2^{l - j}} < a_{k} \\ i_{j - 1} & i_{j - 1} + 2^{l - j} \leq k - 1 \land \neg (b_{k - 1, i_{j - 1} + 2^{l - j}} < a_{k}) \end{cases}$ $i_j = \begin{cases} i_{j-1} + 2^{l-j} & i_{j-1} + 2^{l-j} > k-1 \wedge a_d < a_c\\ i_{j-1} & i_{j-1} + 2^{l-j} > k-1 \wedge \neg (a_d < a_c)\\ i_{j-1} + 2^{l-j} & i_{j-1} + 2^{l-j} \leq k-1 \wedge b_{k-1,i_{j-1} + 2^{l-j}} < a_k \\ i_{j-1} & i_{j-1} + 2^{l-j} \leq k-1 \wedge \neg(b_{k-1,i_{j-1} + 2^{l-j}} < a_k) \\ \end{cases}$
Если повторите (5.) иначе $i_l > k$ $b_k=(b_{k-1,1},\dots,b_{k-1,i_l -1},a_k,b_{k-1,i_l},\dots,b_{k-1,k-1})$
Выход $b_n$

Случайный случай: 5 + условие if из 6 - это, по сути, выборка принятия-отклонения. Остальная часть алгоритма - наивный случайный порядок: перемешайте первые элементов и добавьте $k-1$ $k$ элемент в каждую позицию с равной вероятностью. Если бы мы использовали обычную сортировку вставкой, мы бы получили вместо этого биномиальное распределение.

Обратите внимание, что этот алгоритм неэффективен в обоих режимах по сравнению со случайной сортировкой Фишера-Йейтса и сортировкой слиянием, поскольку вставка элемента в произвольную позицию является дорогой, если использование массива и бинарный поиск требуют линейного времени при использовании списка. Но, возможно, модификация сортировки кучи или сортировки дерева подобным образом может привести к более быстрому алгоритму.

— frafl
источник

@ Джо, можешь ли ты поместить все свои баллы, все еще действительные для поста в текущей форме, в один комментарий и удалить остальные?

— frafl

Я надеялся на алгоритм, который не делает разные шаги в зависимости от того, какой компаратор используется. Можете ли вы избежать бесконечной петли отклонения, не исследуя компаратор? Я думаю, что вы могли бы избежать отказа, выполнив сначала шаг (3) ...

— Джо

i

$i$

Первый комментарий: обратите внимание, что я не выбрасываю первый бит сэмпла, это «двойное использование». Я думал об инвертировании каждого второго бита, но это не помешало бы бесконечному циклу. На самом деле нужен какой-то нерегулярный шаблон, и он может отклонить гораздо больше записей. Конечно, я мог бы сделать XOR двумя самыми последними битами вместо первого и самого последнего, но это не сильно отличается.

— 2013 г.

i

$i$

a_{n} < a_{1}

$a_n < a_1$

0

$0$

$n \leq 2$ $A/2^B$ $1/n!$ $n > 2$ $1/n!$ $A/2^B$

— Юваль Фильмус
источник

Но это справедливо только в том случае, если нам нужна детерминированная граница времени выполнения, которая не была запрошена в этом вопросе. Если мы только требуем, чтобы ожидаемое время выполнения было конечным, это не должно быть проблемой.

— frafl

Вам известен какой-нибудь разумный алгоритм сортировки, который не заканчивается за полиномиальное время?

— Юваль Фильмус

Вы смешиваете детерминированный и случайный случай. Алгоритм может завершаться в детерминированное полиномное время, если вызывается с помощью детерминированного отношения порядка, и в ожидаемое полиномиальное время, если вызывается с монетой в качестве компаратора.

— frafl

2^{k}

$2^k$

k

$k$

A / 2^{k}

$A/2^k$