Насколько асимптотически плохо наивные тасовки?

Хорошо известно, что этот «наивный» алгоритм перестановки массива путем замены каждого элемента на другой, случайно выбранный, не работает правильно:

for (i=0..n-1)
  swap(A[i], A[random(n)]);

В частности, поскольку на каждой из итераций делается один из вариантов (с одинаковой вероятностью), существует возможных «путей» в вычислениях; потому что количество возможных перестановокне делится равномерно на количество путей , для этого алгоритма невозможно получить каждый изперестановки с равной вероятностью. (Вместо этого следует использовать так называемый случайный случай Фишера-Йейтса , который существенно меняет вызов для выбора случайного числа из [0..n) с вызовом для выбора случайного числа из [i..n); это спорный вопрос, хотя.) $n$ $n$ $n^n$ $n!$ $n^n$ $n!$

Мне интересно, насколько «плохим» может быть наивное перемешивание? Точнее говоря, пусть будет множеством всех перестановок, а будет числом путей через наивный алгоритм, который создает результирующую перестановку , что является асимптотическим поведением функции $P(n)$ $C(\rho)$ $\rho\in P(n)$

$\qquad \displaystyle M(n) = \frac{n!}{n^n}\max_{\rho\in P(n)} C(\rho)$

а также

$\qquad \displaystyle m(n) = \frac{n!}{n^n}\min_{\rho\in P(n)} C(\rho)$ ?

Главным фактором является «нормализация» этих значений: если наивное перемешивание «асимптотически хорошо», то

$\qquad \displaystyle \lim_{n\to\infty}M(n) = \lim_{n\to\infty}m(n) = 1$ .

Я подозреваю (основываясь на некоторых компьютерных симуляциях, которые я видел), что фактические значения ограничены от 1, но известно ли, если $\lim M(n)$ конечен, или если $\lim m(n)$ отделен от 0? Что известно о поведении этих величин?

— Стивен Стадницки
источник

Хороший вопрос Я не знаю, где лучшее место для этого вопроса. Если не ясно, что другой форум лучше для него, я думаю, что вы должны оставить его здесь на неделю или около того, и если вы не получите удовлетворительного ответа, задайте его на одном из других форумов (и вставьте ссылки в оба вопроса ).

— Питер Шор

@vzn "Почему сложный анализ по известному некорректному алгоритму?" Поскольку математика является интересной, и вы никогда не знаете , где могут возникнуть другие приложения - см анализ Кнута пузырьковой сортировки, например. Диаграммы Этвуда дают грубый качественный анализ неоднородности, но это далеко от математически количественного анализа. (И есть несколько различных эквивалентных формулировок Фишера-Yates перетасовки -. В одном я упоминаю работает просто отлично)

— Стивен Stadnicki

Для записи, последовательность OEIS A192053 имеет значение max и не содержит закрытой формы. Кроме того, примечания к этой записи предполагают, что min может быть , подразумевая, что .

C (ρ)

$C(\rho)$

C (ρ)

$C(\rho)$

2^{n - 1}

$2^{n-1}$

m (n) \to 0

$m(n) \rightarrow 0$

— mhum

@vzn Что не так с открытыми вопросами?

— Юваль Фильмус

@vzn Не согласен с твоим последним предложением, там много анализа "несовершенных" перемешиваний. Например, если мы делаем случайные транспозиции, известно, что порог случайности составляет примерно . Нынешний вопрос может быть сложным, но априори трудно сказать, является ли он «очень сложным». Ответ типа mhum уже очень удовлетворяет, показывая, что вопрос был уместен для форума и не представлял непреодолимого барьера (формальные доказательства отложены).

(1 / 2) n \log n

$(1/2) n\log n$

— Юваль Фильмус

Ответы:

По индукции мы покажем, что перестановка является примером с . Если это наихудший случай, как и для первых нескольких (см. Примечания к последовательности OEIS A192053 ), то . Таким образом, нормализованный минимум, как и нормализованный максимум, является «экспоненциально плохим». $\rho_n = (2,3,4,\ldots, n,1)$ $C(\rho_n) = 2^{n-1}$ $n$ $m(n) \approx (2/e)^{n}$

Базовый случай прост. Для шага индукции нам понадобится лемма:

Лемма: На любом пути от до , либо первый ход меняет позиции и , либо последний ход меняет позиции и . $(2,3,4, \ldots, n, 1)$ $(1,2,3, \ldots, n)$ $1$ $n$ $1$ $n$

Эскиз доказательства: предположим, что нет. Рассмотрим первый ход, включающий -ю позицию. Предположим, что это -й ход, и . Этот ход должен поместить элемент в -е место. Теперь рассмотрим следующий ход, который касается предмета . Предположим, этот ход является -м ходом. Этот ход должен поменять местами и , переместив элемент на -е место, где . Аналогичный аргумент говорит о том, что пункт можно только впоследствии сдвинуть вправо. Но пункт $n$ $i$ $i\neq 1$ $i \neq n$ $1$ $i$ $1$ $j$ $i$ $j$ $1$ $j$ $i < j$ $1$ $1$ должно закончиться в первую очередь, противоречие. $\square$

Теперь, если первый ход меняет позиции и , оставшиеся ходы должны переставить в . Если оставшиеся ходы не касаются первой позиции, то это перестановка в позициях , и по индукции мы знаем, что есть пути, которые делают это. Аргумент, аналогичный доказательству леммы, говорит о том, что не существует пути, который касается первой позиции, поскольку элемент должен затем оказаться в неправильной позиции. $1$ $n$ $(1, 3,4,5, \ldots, n,2)$ $(1,2,3,4, \ldots, n)$ $\rho_{n-1}$ $2 \ldots n$ $C(\rho_{n-1})=2^{n-2}$ $1$

Если последний ход меняет местами и , то первые ходы должны перевести перестановку в перестановку . Опять же, если эти шаги не касаются последней позиции, то это перестановка , и по индукции есть путей это сделать И снова, если один из первых ходов коснется последней позиции, элемент никогда не может оказаться в правильном месте. $1$ $n$ $n-1$ $(2,3,4,\ldots, n,1)$ $(n,2, 3,4, \ldots, n-1, 1)$ $\rho_{n-1}$ $C(\rho_{n-1})=2^{n-2}$ $n-1$ $1$

Таким образом, . $C(\rho_n) = 2C(\rho_{n-1}) = 2^{n-1}$

— Питер Шор
источник

Идеально - аргумент, лежащий в основе леммы, очень похож на аргумент, который я использовал для инволюций, являющихся единственным способом получения перестановки идентификаторов, но я упустил рекурсивную структуру в явном обмене. Спасибо!

— Стивен Стадницки

После некоторых поисков благодаря указателю mhum на OEIS я наконец нашел отличный анализ и хороший (относительно) элементарный аргумент (насколько я могу судить, Голдштейну и Мьюзу [1]), что растет сверхэкспоненциально быстро в : $M(n)$ $n$

Любая инволюция of соответствует запуску «наивного» алгоритма тасования, который в качестве результата выдает перестановку идентификаторов, поскольку алгоритм поменяет местами с и впоследствии поменяет местами с , оставляя оба без изменений. Это означает, что число прогонов алгоритма, которые приводят к перестановке тождеств, равно, по крайней мере, числу инволюций (на самом деле, небольшое размышление показывает, что соответствие равно 1-1, и, следовательно, это точно ) и поэтому максимум в ограничен снизу . $\iota$ $\{1\ldots n\}$ $k$ $\iota(k)$ $\iota(k)$ $k$ $Q(n)$ $Q(n)$ $M(n)$ $Q(n)$

$Q(n)$ очевидно, идет по нескольким именам, включая номера телефонов : см. Http://oeis.org/A000085 и http://en.wikipedia.org/wiki/Telephone_number_%28matmatics%29 . Асимптотика хорошо известна, и оказывается, что ; из рекуррентного соотношения можно индуктивно показать, что отношение удовлетворяет и оттуда базовый анализ получает ведущий член в асимптотике, хотя другой сроки требуют более тщательных усилий. Поскольку «масштабный фактор» $Q(n) \approx C\left(\frac{n}{e}\right)^{n/2}e^\sqrt{n}$ $Q(n) = Q(n-1)+(n-1)Q(n-2)$ $R(n) = \frac{Q(n)}{Q(n-1)}$ $\sqrt{n}\lt R(n)\lt\sqrt{n+1}$ $n^{n/2}$ $\frac{n!}{n^n}$ в определении только о , главный член доминирует и дает (асимптотически) . $M(n)$ $C\sqrt{n}e^{-n}$ $Q(n)$ $M(n)\geq Cn^{(n+1)/2}e^{-3n/2+\sqrt{n}}$

На самом деле Гольдштейн и Мьюз продолжают в [1] показать, что перестановка тождеств наиболее вероятна для больших , поэтому на самом деле a и поведение полностью определено. Это все еще оставляет вопрос о поведении открытым; Я не был бы слишком удивлен, если бы это также привело к анализу в их статье, но у меня не было возможности прочитать его достаточно близко, чтобы действительно овладеть их методами, только достаточно, чтобы получить базовый результат. $n$ $\geq$ $\approx$ $M(n)$ $m(n)$

[1] Гольдштейн Д. и Мьюз Д.: «Идентичность - наиболее вероятный случайный обмен для больших n», http://arxiv.org/abs/math/0010066

— Стивен Стадницки
источник

Нетрудно показать, что перестановка является примером с . Если это наихудший случай, как и для первых нескольких , то .

(2, 3, 4, \dots, n, 1)

$(2,3,4,\ldots,n,1)$

C (ρ) = 2^{n - 1}

$C(\rho) = 2^{n-1}$

n

$n$

m (n) \approx (2 / e)^{n}

$m(n) \approx (2/e)^n$

— Питер Шор

@PeterShor Можете ли вы привести основной аргумент? Я чувствую, что мне не хватает какой-то простой версии аргумента инволюции, которая бы работала, но я не совсем понимаю. Я думаю, что даже если это не совсем минимально, этого было бы достаточно; минимальное число кажется маловероятным в и просто зная, что нормализованные max и min являются «экспоненциально плохими», это довольно удовлетворительный ответ.

n

$n$

— Стивен Стадницки

Я добавил ответ с аргументом ... это слишком долго для комментария.

— Питер Шор