Ленивая генерация перестановок


87

Я ищу алгоритм для генерации перестановок набора таким образом, чтобы я мог сделать их ленивый список в Clojure. т.е. я хотел бы перебрать список перестановок, где каждая перестановка не вычисляется до тех пор, пока я ее не запрошу, и все перестановки не должны храниться в памяти сразу.

В качестве альтернативы я ищу алгоритм, в котором для определенного набора он вернет «следующую» перестановку этого набора таким образом, что многократный вызов функции на ее собственном выходе будет циклически проходить через все перестановки исходного набора в какой-то порядок (какой порядок не имеет значения).

Есть такой алгоритм? Большинство алгоритмов генерации перестановок, которые я видел, имеют тенденцию генерировать их все сразу (обычно рекурсивно), что не масштабируется до очень больших наборов. Была бы полезна реализация на Clojure (или другом функциональном языке), но я могу понять это по псевдокоду.

Ответы:


139

Да, это алгоритм «следующая перестановка», и это довольно просто слишком. В стандартной библиотеке шаблонов C ++ (STL) даже есть вызываемая функция next_permutation.

Алгоритм фактически находит следующую перестановку - лексикографически следующую. Идея такова: предположим, вам дана последовательность, скажем «32541». Какая следующая перестановка?

Если вы подумаете, то увидите, что это «34125». И ваши мысли, вероятно, были примерно такими: В "32541",

  • невозможно сохранить фиксированное число «32» и найти более позднюю перестановку в части «541», потому что эта перестановка уже является последней для 5,4, а 1 - она ​​отсортирована в порядке убывания.
  • Таким образом, вам придется заменить «2» на что-то большее - фактически, на наименьшее число, большее, чем в части «541», а именно на 4.
  • Теперь, когда вы решили, что перестановка начнется с «34», остальные числа должны быть в порядке возрастания, поэтому ответ будет «34125».

Алгоритм состоит в том, чтобы реализовать именно эту цепочку рассуждений:

  1. Найдите самый длинный «хвост» в порядке убывания. (Часть "541".)
  2. Измените число непосредственно перед хвостом («2») на наименьшее число, большее, чем в хвосте (4).
  3. Отсортируйте хвост в порядке возрастания.

Вы можете выполнить (1.) эффективно, начав с конца и вернувшись назад, если предыдущий элемент не меньше текущего. Вы можете сделать (2.), просто поменяв местами «4» на «2», так что у вас будет «34521». Как только вы это сделаете, вы можете избежать использования алгоритма сортировки для (3.), потому что хвост был и остается (подумайте об этом), отсортированным в порядке убывания, поэтому его нужно только поменять местами.

Код C ++ делает именно это (посмотрите исходный код в /usr/include/c++/4.0.0/bits/stl_algo.hвашей системе или прочтите эту статью ); его должно быть просто перевести на ваш язык: [Прочтите «BidirectionalIterator» как «указатель», если вы не знакомы с итераторами C ++. Код возвращается, falseесли нет следующей перестановки, т.е. мы уже в порядке убывания.]

template <class BidirectionalIterator>
bool next_permutation(BidirectionalIterator first,
                      BidirectionalIterator last) {
    if (first == last) return false;
    BidirectionalIterator i = first;
    ++i;
    if (i == last) return false;
    i = last;
    --i;
    for(;;) {
        BidirectionalIterator ii = i--;
        if (*i <*ii) {
            BidirectionalIterator j = last;
            while (!(*i <*--j));
            iter_swap(i, j);
            reverse(ii, last);
            return true;
        }
        if (i == first) {
            reverse(first, last);
            return false;
        }
    }
}

Может показаться, что на перестановку может потребоваться O (n) раз, но если вы подумаете об этом более внимательно, вы можете доказать, что для всех перестановок в целом требуется O (n!) Времени, так что только O (1) - постоянное время - перестановка.

Хорошо то, что алгоритм работает, даже если у вас есть последовательность с повторяющимися элементами: скажем, с «232254421», он найдет хвост как «54421», поменяет местами «2» и «4» (так «232454221» ), переверните остальные, получив "232412245", что является следующей перестановкой.


2
Это сработает, если у вас есть полный порядок элементов.
Крис Конвей,

10
Если вы начнете с набора, вы можете произвольно определить общий порядок элементов; сопоставьте элементы с различными числами. :-)
ShreevatsaR

3
Этот ответ просто не набирает достаточно голосов, но я могу проголосовать за него только один раз ... :-)
Дэниел С. Собрал

1
@Masse: Не совсем ... грубо говоря, вы можете перейти от 1 к большему числу. Используя пример: Начните с 32541. Хвост - 541. После выполнения необходимых шагов следующая перестановка - 34125. Теперь хвост - всего 5. Увеличивая 3412 с помощью 5 и меняя местами, следующая перестановка - 34152. Теперь хвост равен 52, длины 2. Тогда получается 34215 (длина хвоста 1), 34251 (длина хвоста 2), 34512 (длина 1), 34521 (длина 3), 35124 (длина 1) и т. Д. Вы правы, что хвост маленький в большинстве случаев, поэтому алгоритм имеет хорошую производительность при нескольких вызовах.
ShreevatsaR 06

1
@SamStoelinga: На самом деле, вы правы. O (n log n) равно O (log n!). Я должен был сказать О (п!).
ShreevatsaR

42

Предполагая, что мы говорим о лексикографическом порядке переставляемых значений, вы можете использовать два общих подхода:

  1. преобразовать одну перестановку элементов в следующую перестановку (как опубликовал ShreevatsaR), или
  2. непосредственно вычислить nth перестановку, считая nот 0 вверх.

Для тех (вроде меня ;-), кто не говорит на C ++ как носители языка, подход 1 может быть реализован из следующего псевдокода, предполагающего отсчитываемую от нуля индексацию массива с нулевым индексом «слева» (заменяя некоторую другую структуру , например список, "оставлено как упражнение" ;-):

1. scan the array from right-to-left (indices descending from N-1 to 0)
1.1. if the current element is less than its right-hand neighbor,
     call the current element the pivot,
     and stop scanning
1.2. if the left end is reached without finding a pivot,
     reverse the array and return
     (the permutation was the lexicographically last, so its time to start over)
2. scan the array from right-to-left again,
   to find the rightmost element larger than the pivot
   (call that one the successor)
3. swap the pivot and the successor
4. reverse the portion of the array to the right of where the pivot was found
5. return

Вот пример, начинающийся с текущей перестановки CADB:

1. scanning from the right finds A as the pivot in position 1
2. scanning again finds B as the successor in position 3
3. swapping pivot and successor gives CBDA
4. reversing everything following position 1 (i.e. positions 2..3) gives CBAD
5. CBAD is the next permutation after CADB

Для второго подхода (прямое вычисление nth перестановки) помните, что есть N!перестановки Nэлементов. Следовательно, если вы переставляете Nэлементы, первые (N-1)!перестановки должны начинаться с наименьшего элемента, следующие (N-1)!перестановки должны начинаться со второго наименьшего элемента и так далее. Это приводит к следующему рекурсивному подходу (опять же в псевдокоде с нумерацией перестановок и позиций от 0):

To find permutation x of array A, where A has N elements:
0. if A has one element, return it
1. set p to ( x / (N-1)! ) mod N
2. the desired permutation will be A[p] followed by
   permutation ( x mod (N-1)! )
   of the elements remaining in A after position p is removed

Так, например, 13-я перестановка ABCD находится следующим образом:

perm 13 of ABCD: {p = (13 / 3!) mod 4 = (13 / 6) mod 4 = 2; ABCD[2] = C}
C followed by perm 1 of ABD {because 13 mod 3! = 13 mod 6 = 1}
  perm 1 of ABD: {p = (1 / 2!) mod 3 = (1 / 2) mod 2 = 0; ABD[0] = A}
  A followed by perm 1 of BD {because 1 mod 2! = 1 mod 2 = 1}
    perm 1 of BD: {p = (1 / 1!) mod 2 = (1 / 1) mod 2 = 1; BD[1] = D}
    D followed by perm 0 of B {because 1 mod 1! = 1 mod 1 = 0}
      B (because there's only one element)
    DB
  ADB
CADB

Между прочим, «удаление» элементов может быть представлено параллельным массивом логических значений, который указывает, какие элементы все еще доступны, поэтому нет необходимости создавать новый массив при каждом рекурсивном вызове.

Итак, чтобы перебрать перестановки ABCD, просто посчитайте от 0 до 23 (4! -1) и напрямую вычислите соответствующую перестановку.


1
++ Ваш ответ недооценен. Не отрываясь от принятого ответа, но второй подход более эффективен, потому что его можно обобщить и на комбинации. Полное обсуждение покажет обратную функцию от последовательности к индексу.
Die in Sente

1
На самом деле. Я согласен с предыдущим комментарием - хотя в моем ответе выполняется немного меньше операций для конкретного заданного вопроса, этот подход является более общим, поскольку он работает, например, для поиска перестановки, которая находится на K шагов от заданной.
ShreevatsaR

4

Вам следует проверить статью о перестановках в Википеде. Также существует понятие факторадических чисел.

В любом случае математическая задача довольно сложная.

В C#вы можете использовать iteratorи остановить использование алгоритма перестановки yield. Проблема в том, что вы не можете перемещаться вперед и назад или использовать index.


5
«Во всяком случае, математическая задача довольно сложная». Нет, это не так :-)
ShreevatsaR

Ну, это так ... если вы не знаете о числах Factoradic, вы не сможете придумать правильный алгоритм за приемлемое время. Это похоже на попытку решить уравнение 4-й степени, не зная метода.
Богдан Максим

1
Ой, извините, я думал, вы говорите об исходной проблеме. Я до сих пор не понимаю, зачем вам нужны "фактические числа" ... довольно просто присвоить число каждому из n! перестановки данного набора и построить перестановку из числа. [Просто динамическое программирование / подсчет ..]
ShreevatsaR

1
В идиоматическом C # итератор правильнее называть перечислителем .
Дрю Ноукс

@ShreevatsaR: Как бы вы это сделали, если бы не генерировали все перестановки? Например, если вам нужно было сгенерировать n! -Ую перестановку.
Джейкоб

3

Еще примеры алгоритмов перестановки для их генерации.

Источник: http://www.ddj.com/architect/201200326

  1. Использует алгоритм Фике, который является одним из самых быстрых из известных.
  2. Использует алгоритм лексографического порядка.
  3. Использует нелексографический, но работает быстрее, чем пункт 2.

1.


PROGRAM TestFikePerm;
CONST marksize = 5;
VAR
    marks : ARRAY [1..marksize] OF INTEGER;
    ii : INTEGER;
    permcount : INTEGER;

PROCEDURE WriteArray;
VAR i : INTEGER;
BEGIN
FOR i := 1 TO marksize
DO Write ;
WriteLn;
permcount := permcount + 1;
END;

PROCEDURE FikePerm ;
{Outputs permutations in nonlexicographic order.  This is Fike.s algorithm}
{ with tuning by J.S. Rohl.  The array marks[1..marksizn] is global.  The   }
{ procedure WriteArray is global and displays the results.  This must be}
{ evoked with FikePerm(2) in the calling procedure.}
VAR
    dn, dk, temp : INTEGER;
BEGIN
IF 
THEN BEGIN { swap the pair }
    WriteArray;
    temp :=marks[marksize];
    FOR dn :=  DOWNTO 1
    DO BEGIN
        marks[marksize] := marks[dn];
        marks [dn] := temp;
        WriteArray;
        marks[dn] := marks[marksize]
        END;
    marks[marksize] := temp;
    END {of bottom level sequence }
ELSE BEGIN
    FikePerm;
    temp := marks[k];
    FOR dk :=  DOWNTO 1
    DO BEGIN
        marks[k] := marks[dk];
        marks[dk][ := temp;
        FikePerm;
        marks[dk] := marks[k];
        END; { of loop on dk }
    marks[k] := temp;l
    END { of sequence for other levels }
END; { of FikePerm procedure }

BEGIN { Main }
FOR ii := 1 TO marksize
DO marks[ii] := ii;
permcount := 0;
WriteLn ;
WrieLn;
FikePerm ; { It always starts with 2 }
WriteLn ;
ReadLn;
END.

2.


PROGRAM TestLexPerms;
CONST marksize = 5;
VAR
    marks : ARRAY [1..marksize] OF INTEGER;
    ii : INTEGER;
    permcount : INTEGER;

PROCEDURE WriteArray; VAR i : INTEGER; BEGIN FOR i := 1 TO marksize DO Write ; permcount := permcount + 1; WriteLn; END;

PROCEDURE LexPerm ; { Outputs permutations in lexicographic order. The array marks is global } { and has n or fewer marks. The procedure WriteArray () is global and } { displays the results. } VAR work : INTEGER: mp, hlen, i : INTEGER; BEGIN IF THEN BEGIN { Swap the pair } work := marks[1]; marks[1] := marks[2]; marks[2] := work; WriteArray ; END ELSE BEGIN FOR mp := DOWNTO 1 DO BEGIN LexPerm<>; hlen := DIV 2; FOR i := 1 TO hlen DO BEGIN { Another swap } work := marks[i]; marks[i] := marks[n - i]; marks[n - i] := work END; work := marks[n]; { More swapping } marks[n[ := marks[mp]; marks[mp] := work; WriteArray; END; LexPerm<> END; END;

BEGIN { Main } FOR ii := 1 TO marksize DO marks[ii] := ii; permcount := 1; { The starting position is permutation } WriteLn < Starting position: >; WriteLn LexPerm ; WriteLn < PermCount is , permcount>; ReadLn; END.

3.


PROGRAM TestAllPerms;
CONST marksize = 5;
VAR
    marks : ARRAY [1..marksize] of INTEGER;
    ii : INTEGER;
    permcount : INTEGER;

PROCEDURE WriteArray; VAR i : INTEGER; BEGIN FOR i := 1 TO marksize DO Write ; WriteLn; permcount := permcount + 1; END;

PROCEDURE AllPerm (n : INTEGER); { Outputs permutations in nonlexicographic order. The array marks is } { global and has n or few marks. The procedure WriteArray is global and } { displays the results. } VAR work : INTEGER; mp, swaptemp : INTEGER; BEGIN IF THEN BEGIN { Swap the pair } work := marks[1]; marks[1] := marks[2]; marks[2] := work; WriteArray; END ELSE BEGIN FOR mp := DOWNTO 1 DO BEGIN ALLPerm<< n - 1>>; IF > THEN swaptemp := 1 ELSE swaptemp := mp; work := marks[n]; marks[n] := marks[swaptemp}; marks[swaptemp} := work; WriteArray; AllPerm< n-1 >; END; END;

BEGIN { Main } FOR ii := 1 TO marksize DO marks[ii] := ii permcount :=1; WriteLn < Starting position; >; WriteLn; Allperm < marksize>; WriteLn < Perm count is , permcount>; ReadLn; END.


2

функция перестановок в clojure.contrib.lazy_seqs уже утверждает, что делает именно это.


Спасибо, я не знал об этом. Он утверждает, что он ленив, но, к сожалению, работает очень плохо и легко переполняет стек.
Брайан Карпер,

Лень, безусловно, может вызвать переполнение стека, как объясняется, например, в этом ответе.
crockeea
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.