Когда списки смежности или матрицы являются лучшим выбором?

Мне сказали, что мы будем использовать список, если граф разреженный, и матрицу, если граф плотный . Для меня это просто грубое определение. Я не вижу многого за этим. Можете ли вы уточнить, когда это будет естественным выбором?

Заранее спасибо!

— user21312
источник

Связанный: stackoverflow.com/a/2218331/5746050 и stackoverflow.com/a/5419933/5746050

— Райана

Это не определение, в основном потому, что не существует единого определения понятий «разреженный» и «плотный». Кроме того, есть и другие соображения, например, к каким аспектам графа вы обращаетесь как часто.

— Рафаэль

@ Рафаэль Можете ли вы рассказать подробнее о других соображениях?

— user21312

@ user21312, большая разница - итеративность и доступ к краям. Если вам часто нужно перебирать края, то список приставок может быть более полезным. Если вам часто нужно определить, существует ли ребро или получить доступ к его весу (или другой информации), тогда матрица может быть лучше.

— Райана

Для вашей цели мы, вероятно, могли бы небрежно относиться к определению «разреженный» и «плотный». Просто смоделируйте временную сложность работы матрицы, которую вы хотите использовать для каждого типа структуры данных, и посмотрите, где находится «точка разрыва плотности». Я думаю, что вторая ссылка @ryan пытается сделать нечто подобное

— Apiwat Chantawibul

Ответы:

Прежде всего, обратите внимание, что разреженный означает, что у вас очень мало ребер, а плотный означает много ребер, или почти полный граф. В полном графе у вас есть ребер, где - количество узлов. $n(n-1)/2$ $n$

Теперь, когда мы используем матричное представление, мы выделяем матрицу для хранения информации о соединении узлов, например, если между узлами и есть ребро , в противном случае . Но если мы используем список смежности, то у нас есть массив узлов, и каждый узел указывает на свой список смежности, содержащий ТОЛЬКО соседние узлы . $n\times n$ $M[i][j] = 1$ $i$ $j$ $M[i][j] = 0$

Теперь, если график разрежен, и мы используем матричное представление, тогда большинство ячеек матрицы остаются неиспользованными, что приводит к пустой трате памяти. Таким образом, мы обычно не используем матричное представление для разреженных графов. Мы предпочитаем список смежности.

Но если граф плотный, то число ребер близко к (полному) или к если граф направлен с помощью самоконтроля. Тогда нет преимущества использования списка смежности над матрицей. $n(n-1)/2$ $n^2$

С точки зрения сложности пространства
Матрица смежности: Список смежности: где - количество узлов, - количество ребер. $O(n^2)$
$O(n + m)$
$n$ $m$

Когда граф является неориентированным деревом, тогда
матрица смежности: Список смежности: равно (лучше, чем ) $O(n^2)$
$O(n + n)$ $O(n)$ $n^2$

Когда график направлен, завершен, с самопетлями, тогда
матрица смежности: Список смежности: есть (без разницы) $O(n^2)$
$O(n + n^2)$ $O(n^2)$

И, наконец, когда вы реализуете использование матрицы, проверка наличия грани между двумя узлами занимает раз, в то время как со списком смежности это может занять линейное время по . $O(1)$ $n$

— fade2black
источник

«хотя со списком смежности это может занять линейное время» - учитывая, что в вашем списке смежности (вероятно) отсутствует какой-либо естественный порядок, почему это список вместо хэш-набора?

— Кевин

@Kevin Тогда это будет называться «хэш смежности» вместо «список». Также возможно, почему нет? Но если вы просто выполняете DFS или BFS, или какую-то другую процедуру, которая систематически сканирует все узлы, то в чем преимущество использования хэширования над списком? В любом случае вы бы осмотрели все соседние узлы.

— fade2black

Я бы добавил, что в невзвешенном неориентированном случае для почти полного графа может быть более целесообразно хранить его дополнение, то есть разреженный граф. Поэтому матрица полезна, когда присутствует примерно половина ребер.

— М. Зима

Чтобы ответить, приведем простую аналогию. Если бы вам пришлось хранить 6 унций воды, вы бы (вообще говоря) сделали это с контейнером на 5 галлонов или чашкой на 8 унций?

Теперь вернемся к вашему вопросу. Если большая часть вашей матрицы пуста, то зачем ее использовать? Просто перечислите каждое значение вместо этого. Однако, если ваш список очень длинный, почему бы не использовать матрицу для его сжатия?

В этом случае аргументация списка против матрицы действительно так проста.

PS список - это просто матрица из одного столбца !!! (пытаюсь показать вам, насколько произвольно это решение / сценарий)

— Чарльз
источник

$N$ $E$ $N^2$

Сколько бит на самом деле вам нужно?

$N$ $E$ ${N^2 \choose E}$ $\log_2 {N^2 \choose E}$

$E \le \frac{N^2}{2}$

$E = \frac{N^2}{2}$ $\log_2{N^2 \choose E} = N^2 + o(N^2)$ $E \ll N^2$

\log_{2} (\binom{N^{2}}{E})

$\log_2 {N^2 \choose E}$

= \log_{2} \frac{(N^{2})!}{E! (N^{2} - E)!}

$= \log_2 \frac {(N^2)!} {E! (N^2 - E)!}$

= 2 E \log_{2} N + O (low order terms)

$= 2E \log_2 N + O(\hbox{low order terms})$

$\log_2 N$ $2E$

$p = \frac{E}{N^2}$ $- \log_2{p(1-p)}$ $p \approx \frac{1}{2}$

— Псевдоним
источник