Практическое использование различных структур данных [закрыто]


102

О структурах данных много говорят, но я не могу найти там простого списка структур данных и их практического использования. Я пытаюсь подготовиться к интервью, и я думаю, что это поможет мне, как и многим другим. Я ищу что-то вроде этого:

Структура данных - Пример / Используется для

Хеш-таблица - быстрый поиск данных ... затем приведите пример

Массив - ...

Двоичное дерево - ...

Если где-то есть такой ресурс, дайте мне знать.

Спасибо!

РЕДАКТИРОВАТЬ: Я имею в виду, что википедия хороша и все такое, но на большинстве страниц они фактически не указывают практическое использование. Я ищу нечто большее.

Ответы:


96

Нашел список в аналогичном вопросе, ранее на StackOverflow:

Хеш-таблица - используется для быстрого поиска данных - таблица символов для компиляторов, индексация базы данных, кеши, уникальное представление данных.

Trie - словарь, например, найденный в мобильном телефоне для автозаполнения и проверки орфографии.

Дерево суффиксов - быстрый полнотекстовый поиск, используемый в большинстве текстовых процессоров.

Стек - отмена \ повтор операции в текстовых процессорах, оценка выражений и синтаксический анализ, многие виртуальные машины, такие как JVM, ориентированы на стек.

Очереди - исследование транспорта и операций, в котором различные объекты хранятся и предназначены для обработки позже, т.е. очередь выполняет функцию буфера.

Приоритетные очереди - планирование процессов в ядре

Деревья - парсеры, файловая система

Основное дерево - таблица IP-маршрутизации

BSP tree - 3D компьютерная графика

Графики - Связи / отношения в социальных сетях, маршрутизация, сети связи, организация данных и т. Д.

Куча - динамическое выделение памяти в lisp

Это ответ, первоначально опубликованный RV Pradeep

Некоторые другие, менее полезные ссылки:

Приложения указаны только для некоторых структур данных

Не ориентировано на приложение, хорошее резюме и актуальное


1
ваша первая ссылка не работает
Дэн Болье

Спасибо, @DanBeaulieu. Убрал мертвую ссылку.
MXMLLN

1
Очень красивое резюме. Возможно, список использований никогда не заканчивается, но суть понятна.
Ник Л.

1
Действительно ли отмена / повтор будет стеком? Если отмена произошла с вершины стека, то вы не сможете повторить операцию.
Тони Л.

5
@TonyL. Я знаю, что это более старый вопрос, но я считаю, что используются 2 стека или Undo / Redo. Когда вы отменяете действие, оно извлекается из стека действий и помещается в стек повтора. Если вы повторяете, вы затем извлекаете его из стека повтора и помещаете в стек действий. Возможно, я ошибаюсь в терминологии, но примеры должны быть.
Рик Хендерсон

14

Я в той же лодке, что и ты. Мне нужно подготовиться к техническим собеседованиям, но запоминание списка бесполезно. Если у вас есть 3-4 часа в запасе, и вы хотите совершить более глубокое погружение, я рекомендую проверить

mycodeschool
Я просмотрел Coursera и другие ресурсы, такие как блоги и учебники, но считаю, что они либо недостаточно полны, либо находятся на другом конце спектра, слишком насыщены необходимой терминологией по информатике.

Чувак в видео прочитал кучу лекций о структурах данных. Не обращайте внимания на глупые рисунки или легкий акцент. Вы должны понимать не только, какую структуру данных выбрать, но и некоторые другие моменты, которые следует учитывать, когда люди думают о структурах данных:

  • плюсы и минусы общих структур данных
  • почему существует каждая структура данных
  • как это на самом деле работает в памяти
  • конкретные вопросы / упражнения и решение, какую структуру использовать для максимальной эффективности
  • ясное объяснение Big 0

Я также разместил заметки на github, если вам интересно.


7

Насколько я понимаю, структура данных - это любые данные, находящиеся в памяти любой электронной системы, которыми можно эффективно управлять. Часто это игра памяти или более быстрого доступа к данным. Что касается памяти, то при управлении данными приходится идти на компромиссы, основанные на стоимости конечного продукта для компании. Эффективное управление говорит нам, как наилучшим образом можно получить доступ к данным, исходя из основных требований конечного продукта. Это объяснение очень высокого уровня, но структуры данных - обширная тема. Большинство интервьюеров погружаются в структуры данных, которые они могут позволить себе обсуждать на собеседовании в зависимости от имеющегося у них времени, которые представляют собой связанные списки и связанные темы.

Теперь эти типы данных можно разделить на примитивные, абстрактные, составные в зависимости от способа их логического построения и доступа.

  • примитивные структуры данных являются основными строительными блоками для всех структур данных, у них есть непрерывная память для них: boolean, char, int, float, double, string.
  • Составные структуры данных - это структуры данных, которые состоят из нескольких примитивных типов данных: класс, структура, объединение, массив / запись.
  • абстрактные типы данных - это составные типы данных, у которых есть способ эффективного доступа к ним, который называется алгоритмом. В зависимости от способа доступа к данным структуры данных делятся на линейные и нелинейные типы данных. Связанные списки, стопки, очереди и т. Д. Являются линейными типами данных. кучи, двоичные деревья, хэш-таблицы и т. д. являются нелинейными типами данных.

Надеюсь, это поможет вам погрузиться в жизнь.


6

Прекрасная книга Скиенны «Руководство по проектированию алгоритмов» содержит огромный репозиторий алгоритмов и структур данных.

Для множества проблем описываются, сравниваются структуры данных и алгоритмы, а также обсуждается практическое использование. Автор также предоставляет ссылки на реализации и оригинальные исследовательские работы.

Если вы ищете лучшую структуру данных для решения вашей проблемы, удобно иметь ее у себя на столе. Это также очень полезно для подготовки к собеседованию.

Еще один отличный ресурс - Словарь структур данных и алгоритмов NIST .


4

Еще несколько примеров практического применения структур данных

Красно-черные деревья (используются при частых вставках / удалениях и небольшом количестве поисков) - К-среднее кластеризация с использованием красно-черного дерева, базы данных, простая база данных, поиск слов в словарях, поиск в Интернете

Деревья AVL (больше поиска и меньше вставки / удаления) - Анализ данных и интеллектуальный анализ данных, а также приложения, которые включают больше поисков

Мин. Куча - алгоритмы кластеризации


3

Любое ранжирование различных структур данных будет хотя бы частично привязано к контексту проблемы. Это помогло бы научиться анализировать производительность алгоритмов во времени и пространстве. Как правило, используется «большая нотация O», например, двоичный поиск выполняется за время O (log n), что означает, что время для поиска элемента - это журнал (в базе 2, неявно) количества элементов. Интуитивно понятно, поскольку каждый шаг отбрасывает половину оставшихся данных как несущественные, удвоение количества элементов увеличивает время на 1 шаг. (Двоичный поиск довольно хорошо масштабируется.) Производительность по пространству связана с увеличением объема памяти для больших наборов данных. Также обратите внимание, что нотация big-O игнорирует постоянные коэффициенты - для меньших наборов данных алгоритм O (n ^ 2) может быть быстрее, чем алгоритм O (n * log n), который имеет более высокий постоянный коэффициент.

Помимо времени и пространства, к другим характеристикам относятся: отсортирована ли структура данных (деревья и скиплисты отсортированы, хэш-таблицы - нет), постоянство (двоичные деревья могут повторно использовать указатели из более старых версий, в то время как хеш-таблицы изменяются на месте) и т. Д.

Хотя вам нужно изучить поведение нескольких структур данных, чтобы иметь возможность сравнивать их, один из способов понять, почему они различаются по производительности, - это внимательно изучить несколько. Я предлагаю сравнить односвязные списки, бинарные деревья поиска и списки пропуска , которые относительно просты, но имеют очень разные характеристики. Подумайте, сколько работы требуется, чтобы найти значение, добавить новое значение, найти все значения по порядку и т. Д.

Существуют различные тексты по анализу производительности алгоритмов / структур данных, которые люди рекомендуют, но что действительно имело смысл для меня, так это изучение OCaml. Работа со сложными структурами данных - сильная сторона ML, и их поведение становится намного яснее, когда вы можете избежать указателей и управления памятью, как в C. (Однако изучение OCaml только для понимания структур данных почти наверняка является долгим путем. :))

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.