Оценка средней сложности времени данного алгоритма сортировки пузырьков.

11

Учитывая этот псевдокод пузырьковой сортировки:

FOR i := 0 TO arraylength(list) STEP 1  
    switched := false
    FOR j := 0 TO arraylength(list)-(i+1) STEP 1
        IF list[j] > list[j + 1] THEN
            switch(list,j,j+1)
            switched := true
        ENDIF
    NEXT
    IF switched = false THEN
        break
    ENDIF
NEXT

Какие основные идеи я должен иметь в виду, чтобы оценить среднюю сложность по времени? Я уже выполнены вычисления худших и лучших случаях, но я застрял дискуссионный как оценить среднюю сложность внутреннего цикла, чтобы сформировать уравнение.

В худшем случае уравнение имеет вид:

\sum_{i = 0}^{n} (\sum_{j = 0}^{n - (i + 1)} O (1) + O (1)) = O (\frac{n^{2}}{2} + \frac{n}{2}) = O (n^{2})

$\sum_{i=0}^n \left(\sum_{j=0}^{n -(i+1)}O(1) + O(1)\right) = O(\frac{n^2}{2} + \frac{n}{2}) = O(n^2)$

в которой внутренняя сигма представляет внутреннюю петлю, а внешняя сигма представляет внешнюю петлю. Я думаю, что мне нужно изменить обе сигмы из-за предложения if-then-break, которое может повлиять на внешнюю сигму, но также из-за предложения if во внутреннем цикле, что повлияет на действия, выполняемые во время цикла (4 действия + 1 сравнение, если верно, иначе только 1 сравнение).

Для пояснения термина «среднее время»: этому алгоритму сортировки потребуется разное время в разных списках (одинаковой длины), поскольку алгоритму может потребоваться больше или меньше шагов через / внутри циклов, пока список не станет полностью упорядоченным. Я пытаюсь найти математический (не статистический способ) оценки среднего числа необходимых раундов.

Для этого я ожидаю, что любой заказ будет такой же возможности.

— Сим
источник

6

Сначала вы должны определить, что означает среднее значение. Поскольку алгоритм является детерминированным, вы должны принять какое-то распределение по входам.

— Суреш

@Sim Можете ли вы показать, как вы рассчитали сложность времени наихудшего случая? Затем мы можем получить представление о том, что вы подразумеваете под средней сложностью в вашем случае.

— 0x0

Я имею в виду среднее время с точки зрения наиболее вероятного необходимого времени (или, другими словами, «чистой» математической версии: среднее значение за все время, наблюдаемое при статистическом анализе). Например, быстрая сортировка имеет среднее значение nlogn, хотя ее наихудший случай равен n ^ 2.

— Сим

1

@Sim В случае среднего значения пузырьковой сортировки = сложность времени в наихудшем случае, т. Е. Средняя сложность времени также

n^{2}

$n^2$

— 0x0

3

Есть разница «при выборе стержень над выбором бросков монеты» , которая не имеет ничего общего с данными быстрой сортировки усредняется. В то время как вы подразумеваете, что вы хотите усреднить «по всем входам», что предполагает (например), что вы ожидаете, что каждое упорядочение входных данных произойдет с одинаковой вероятностью. это разумно, но это должно быть указано явно.

— Суреш

9

Для списков длины среднее обычно означает, что вы должны начать с равномерного распределения по всемперестановки [ , .., ]: это будут все списки, которые вы должны рассмотреть. $n$ $n!$ $1$ $n$

Ваша средняя сложность будет тогда суммой числа шагов для всех списков, деленных на, $n!$

Для заданного списка число шагов вашего алгоритма где $(x_i)_i$ $nd$ $d$ $x_i$ $i$ $\max_i(\max(1,i-x_i))$

Затем вы делаете математику: для каждого найдите число списков с этим конкретным максимальным расстоянием, тогда ожидаемое значение будет: $d$ $c_d$ $d$

\frac{1}{n!} \sum_{d = 0}^{n} d c_{d}

$\frac1{n!}\ \sum_{d=0}^n{\ dc_d}$

И вот основные мысли без трудная часть , которая находя . Может быть, есть более простое решение, хотя. $c_d$

EDIT: добавлен `ожидаемый»

— jmad
источник

Если вы считаете нормальное распределение, есть ли способ приблизить ?

c_{d}

$c_d$

— Сим

Можно сказатьпотому что вы можете общаться в любом месте всех перестановок [ , .., ] и Append в конце , но это к маленьким , чтобы доказать в среднем.

c_{d} \geq (n + 1 - d) (d - 1)!

$c_d≥(n+1-d)(d-1)!$

2

$2$

d

$d$

1

$1$

n ²

$n²$

— jmad

19

Напомним , что пара (соотв. ) инвертируется , если и . $(A[i], A[j])$ $(i,j)$ $i < j$ $A[i] > A[j]$

Предполагая, что ваш алгоритм выполняет один своп для каждой инверсии, время работы вашего алгоритма будет зависеть от числа инверсий.

Вычислить ожидаемое количество инверсий в равномерной случайной перестановке легко:

Пусть перестановка, и пусть будет обратным . Например, если , то . $P$ $R(P)$ $P$ $P = 2,1,3,4$ $R(P) = 4,3,1,2$

Для каждой пары индексов существует инверсия ровно в одном из или . $(i,j)$ $P$ $R(P)$

Так как общее число пар , а общее число и каждая пара инвертируется в ровно половина из перестановок, предполагая , что все перестановки в одинаковой степени, ожидаемое число инверсий: $n(n-1)/2$

\frac{n (n - 1)}{4}

$\frac{n(n-1)}{4}$

— Джо
источник

это оценивает количество инверсий. но как о количестве сравнений , которое зависит от времени обкатки оговорки ступенчатой в

— Sim

Вы получаете одно сравнение по свопу, и, что самое важное, один своп может уменьшить количество инверсий максимум на одну.

— jmad

не раз результаты сравнения в своп, если если придаточного ложно, никакой инверсии делается.

— Sim

@rgrig Если вы предоставите контрпример, я исправлю свой ответ.

— Джо

@Joe: Я удалил свой комментарий. Это было не правильно.

— rgrig

2

Число перестановок <Количество итераций (как в оптимизированном, так и в простом сценарии с пузырьками)

Количество инверсий = количество свопов.

Следовательно, число итераций> $\frac{n(n-1)}{4}$

Таким образом, средняя сложность случая равна . Но, поскольку средний случай не может превышать худшего, мы получаем, что это , $\omega(n^2)$ $O(n^2)$

Это дает нам: Среднее время = $\theta(n^2)$

(Временная сложность = Количество итераций № итераций> Количество свопов)

— kushj
источник

0

в этом документе средняя сложность времени пузырьковой сортировки достигла O (nlog (n))! http://algo.inria.fr/flajolet/Publications/ViFl90.pdf

— user84630
источник

1

n^{2} / 2

$n^2/2$