Что и где находится стек и куча?


8105

Книги по языку программирования объясняют, что типы значений создаются в стеке , а ссылочные типы создаются в куче , без объяснения того, что представляют собой эти две вещи. Я не прочитал четкое объяснение этого. Я понимаю, что такое стек . Но,

  • Где и что они (физически в памяти реального компьютера)?
  • В какой степени они контролируются ОС или языком выполнения?
  • Какова их сфера применения?
  • От чего зависит размер каждого из них?
  • Что делает быстрее?

175
действительно хорошее объяснение можно найти здесь. В чем разница между стеком и кучей?
Сонго

12
Также (действительно) хорошо: codeproject.com/Articles/76153/… (часть стека / кучи)
Бен


3
Связано, смотрите Stack Clash . Исправления Stack Clash затронули некоторые аспекты системных переменных и поведения, например rlimit_stack. Также смотрите Red Hat Issue 1463241
17

3
@mattshane Определения стека и кучи не зависят от значения и ссылочных типов. Другими словами, стек и куча могут быть полностью определены, даже если значения и ссылочные типы никогда не существовали. Кроме того, при понимании значений и ссылочных типов стек является лишь деталью реализации. Пер Эрик Липперт: Стек - это деталь реализации, часть первая .
Матфея

Ответы:


5968

Стек - это память, выделенная как пустое место для потока выполнения. Когда вызывается функция, блок резервируется в верхней части стека для локальных переменных и некоторых бухгалтерских данных. Когда эта функция возвращается, блок становится неиспользуемым и может использоваться при следующем вызове функции. Стек всегда зарезервирован в порядке LIFO (последний в порядке поступления); последний зарезервированный блок всегда является следующим блоком, который должен быть освобожден. Это действительно упрощает отслеживание стека; освобождение блока из стека - это не более, чем настройка одного указателя.

Куча памяти выделяется для динамического выделения. В отличие от стека, нет принудительного шаблона для выделения и освобождения блоков из кучи; Вы можете выделить блок в любое время и освободить его в любое время. Это значительно усложняет отслеживание того, какие части кучи выделены или свободны в любой момент времени; Есть много пользовательских распределителей кучи, доступных для настройки производительности кучи для различных моделей использования.

Каждый поток получает стек, в то время как для приложения обычно есть только одна куча (хотя весьма часто иметь несколько куч для разных типов размещения).

Чтобы ответить на ваши вопросы напрямую:

В какой степени они контролируются ОС или языковой средой выполнения?

ОС выделяет стек для каждого потока системного уровня при его создании. Обычно ОС вызывается языковой средой выполнения для выделения кучи для приложения.

Какова их сфера применения?

Стек присоединен к потоку, поэтому, когда поток выходит из стека, он освобождается. Куча обычно выделяется при запуске приложения средой выполнения и восстанавливается при выходе из приложения (технически процесса).

От чего зависит размер каждого из них?

Размер стека устанавливается при создании потока. Размер кучи устанавливается при запуске приложения, но может увеличиваться по мере необходимости (распределитель запрашивает больше памяти у операционной системы).

Что делает быстрее?

Стек работает быстрее, потому что шаблон доступа упрощает выделение и освобождение памяти из него (указатель / целое число просто увеличивается или уменьшается), в то время как куча имеет гораздо более сложную бухгалтерию, вовлеченную в распределение или освобождение. Кроме того, каждый байт в стеке имеет тенденцию использоваться очень часто, что означает, что он, как правило, отображается в кэш процессора, что делает его очень быстрым. Другим ударом производительности для кучи является то, что куча, являющаяся главным образом глобальным ресурсом, как правило, должна быть многопоточной безопасной, то есть каждое распределение и освобождение должно быть - как правило - синхронизировано со «всеми» другими обращениями к куче в программе.

Наглядная демонстрация:
Источник изображения: vikashazrati.wordpress.com


75
Хороший ответ - но я думаю, что вы должны добавить, что хотя стек выделяется ОС при запуске процесса (при условии существования ОС), он поддерживается программой встроенным. Это еще одна причина, по которой стек работает быстрее: операции push и pop обычно представляют собой одну машинную инструкцию, и современные машины могут выполнять как минимум 3 из них за один цикл, тогда как выделение или освобождение кучи требует обращения к коду ОС.
13

277
Я действительно смущен диаграммой в конце. Я думал, что получил его, пока не увидел это изображение.
Сина Мадани

10
@ Anarlle процессор выполняет инструкции с или без ОС. Пример, близкий моему сердцу, - это SNES, у которого не было ни вызовов API, ни ОС, как мы ее знаем сегодня - но у нее был стек. Выделение в стеке - сложение и вычитание в этих системах, и это хорошо для переменных, уничтожаемых, когда они выталкиваются, возвращаясь из функции, которая их создала, но ограничивают это, скажем, конструктором, результат которого не может быть просто выброшенный. Для этого нам нужна куча, которая не привязана к вызову и возврату. У большинства ОС есть куча API, нет причин делать это самостоятельно
sqykly 13.10.16

2
msgstr "стек - это память, выделенная как пустое место". Круто. Но где это на самом деле «откладывается» с точки зрения структуры памяти Java? Является ли это кучей памяти / не кучей памяти / Другое (структура памяти Java согласно betsol.com/2017/06/… )
Джатин Шашу

4
@JatinShashoo Java runtime, как интерпретатор байт-кода, добавляет еще один уровень виртуализации, так что вы упомянули лишь точку зрения Java-приложения. С точки зрения операционной системы все это просто куча, где исполняющий процесс Java выделяет часть своего пространства как память «без кучи» для обработанного байт-кода. Остальная часть этой кучи на уровне ОС используется в качестве кучи на уровне приложения, где хранятся данные объекта.
августа

2350

стек:

  • Хранится в оперативной памяти компьютера, как в куче.
  • Переменные, созданные в стеке, выйдут из области видимости и будут автоматически освобождены.
  • Гораздо быстрее выделить по сравнению с переменными в куче.
  • Реализовано с фактической структурой данных стека.
  • Хранит локальные данные, обратные адреса, используемые для передачи параметров.
  • Может иметь переполнение стека, когда используется слишком много стека (в основном из-за бесконечной или слишком глубокой рекурсии, очень больших выделений).
  • Данные, созданные в стеке, могут использоваться без указателей.
  • Вы бы использовали стек, если точно знаете, сколько данных вам нужно выделить до компиляции, и он не слишком велик.
  • Обычно максимальный размер уже определен при запуске вашей программы.

Heap:

  • Хранится в оперативной памяти компьютера, как в стеке.
  • В C ++ переменные в куче должны быть уничтожены вручную и никогда не выпадать из области видимости. Данные освобожден с delete, delete[]или free.
  • Медленнее выделять по сравнению с переменными в стеке.
  • Используется по требованию для выделения блока данных для использования программой.
  • Может иметь фрагментацию, когда есть много выделений и освобождений.
  • В C ++ или C данные, созданные в куче, будут указываться указателями и размещаться с newили mallocсоответственно.
  • Может иметь ошибки выделения, если запрошен слишком большой буфер.
  • Вы бы использовали кучу, если не знаете точно, сколько данных вам понадобится во время выполнения или если вам нужно выделить много данных.
  • Ответственный за утечки памяти.

Пример:

int foo()
{
  char *pBuffer; //<--nothing allocated yet (excluding the pointer itself, which is allocated here on the stack).
  bool b = true; // Allocated on the stack.
  if(b)
  {
    //Create 500 bytes on the stack
    char buffer[500];

    //Create 500 bytes on the heap
    pBuffer = new char[500];

   }//<-- buffer is deallocated here, pBuffer is not
}//<--- oops there's a memory leak, I should have called delete[] pBuffer;

31
Указатель pBuffer и значение b расположены в стеке и, скорее всего, расположены на входе в функцию. В зависимости от компилятора, буфер также может быть выделен на входе функции.
Энди

36
Распространенным заблуждением является то, что для Cязыка, определенного C99стандартом языка (доступно на open-std.org/JTC1/SC22/WG14/www/docs/n1256.pdf ), требуется «стек». На самом деле, слово «стек» даже не встречается в стандарте. Это отвечает на утверждения относительно Cиспользования стека в общем случае, но оно никоим образом не требуется языком. См. Knosof.co.uk/cbook/cbook.html для получения дополнительной информации и, в частности, о том, как Cэто реализовано на нечетных архитектурах, таких как en.wikipedia.org/wiki/Burroughs_large_systems
johne

55
@Brian Вы должны объяснить, почему buffer [] и указатель pBuffer создаются в стеке и почему данные pBuffer создаются в куче. Я думаю, что некоторые ответы могут быть смущены вашим ответом, поскольку они могут подумать, что программа специально указывает, что память должна быть выделена в стеке, а не в куче, но это не так. Это потому, что Buffer является типом значения, тогда как pBuffer является ссылочным типом?
Howiecamp

9
@Remover: ни один указатель не содержит адрес, и он может указывать на что-то в куче или стеке одинаково. new, malloc и некоторые другие функции, подобные malloc, выделяют в куче и возвращают адрес памяти, которая была выделена. Почему вы хотите выделить в куче? Так что ваша память не выйдет из области видимости и будет освобождена, пока вы этого не захотите.
Брайан Р. Бонди

35
«Ответственный за утечки памяти» - Кучи не несут ответственности за утечки памяти! Ленивые / Забывчивые / бывшие Java-кодеры / кодеры, которые не дают дерьма!
Лаз

1372

Наиболее важным моментом является то, что куча и стек являются общими терминами для способов выделения памяти. Они могут быть реализованы многими различными способами, и эти термины применяются к основным понятиям.

  • В пачке предметов предметы располагаются один над другим в том порядке, в котором они были там размещены, и вы можете удалить только верхний (не переворачивая все это).

    Стопка, как стопка бумаг

    Простота стека заключается в том, что вам не нужно поддерживать таблицу, содержащую запись каждого раздела выделенной памяти; единственная информация о состоянии, которая вам нужна, - это единственный указатель на конец стека. Чтобы выделить и удалить, вы просто увеличиваете и уменьшаете этот единственный указатель. Примечание: иногда может быть реализован стек, который начинается в верхней части раздела памяти и расширяется вниз, а не растет вверх.

  • В куче нет определенного порядка расположения элементов. Вы можете заходить и убирать предметы в любом порядке, потому что нет четкого «верхнего» предмета.

    Куча как солодка ассорти

    Выделение кучи требует ведения полной записи о том, какая память выделена, а что нет, а также некоторых служебных расходов для уменьшения фрагментации, поиска смежных сегментов памяти, достаточно больших, чтобы соответствовать требуемому размеру, и так далее. Память может быть освобождена в любое время, оставляя свободное место. Иногда распределитель памяти выполняет задачи обслуживания, такие как дефрагментация памяти, перемещая выделенную память или собирая мусор - определяя во время выполнения, когда память больше не находится в области действия, и освобождая ее.

Эти образы должны довольно хорошо описать два способа выделения и освобождения памяти в стеке и куче. Yum!

  • В какой степени они контролируются ОС или языковой средой выполнения?

    Как уже упоминалось, куча и стек являются общими терминами и могут быть реализованы многими способами. Компьютерные программы обычно имеют стек, называемый стеком вызовов, который хранит информацию, относящуюся к текущей функции, такую ​​как указатель на функцию, из которой она была вызвана, и любые локальные переменные. Поскольку функции вызывают другие функции и затем возвращаются, стек увеличивается и сжимается, чтобы хранить информацию от функций дальше по стеку вызовов. Программа на самом деле не имеет контроля над ней во время выполнения; это определяется языком программирования, ОС и даже архитектурой системы.

    Куча - это общий термин, используемый для любой памяти, которая выделяется динамически и случайным образом; т.е. не в порядке. Память обычно выделяется ОС, при этом приложение вызывает функции API для этого. При управлении динамически выделяемой памятью требуются значительные накладные расходы, которые обычно обрабатываются кодом времени выполнения используемого языка программирования или среды.

  • Какова их сфера применения?

    Стек вызовов является настолько низкоуровневой концепцией, что он не имеет отношения к «объему» в смысле программирования. Если вы разберете некоторый код, вы увидите относительные ссылки на стиль указателя на части стека, но, что касается языка более высокого уровня, язык налагает свои собственные правила области видимости. Однако одним важным аспектом стека является то, что, как только функция возвращается, все, что является локальным для этой функции, немедленно освобождается из стека. Это работает так, как вы и ожидаете, учитывая работу ваших языков программирования. В куче это тоже сложно определить. Область действия - это то, что доступно операционной системе, но ваш язык программирования, вероятно, добавляет свои правила о том, что такое «область действия» в вашем приложении. Архитектура процессора и ОС используют виртуальную адресацию, который процессор преобразует в физические адреса, есть ошибки страниц и т. д. Они отслеживают, какие страницы принадлежат каким приложениям. Однако вам никогда не нужно беспокоиться об этом, потому что вы просто используете любой метод, используемый вашим языком программирования, для выделения и освобождения памяти, и проверяете на наличие ошибок (если по какой-либо причине распределение / освобождение не удается).

  • От чего зависит размер каждого из них?

    Опять же, это зависит от языка, компилятора, операционной системы и архитектуры. Стек обычно выделяется заранее, потому что по определению он должен быть смежной памятью. Компилятор языка или ОС определяют его размер. Вы не храните огромные порции данных в стеке, поэтому они будут достаточно большими, чтобы никогда не использовать их полностью, за исключением случаев нежелательной бесконечной рекурсии (отсюда «переполнение стека») или других необычных программных решений.

    Куча - это общий термин для всего, что может быть динамически выделено. В зависимости от того, как вы на это смотрите, размер постоянно меняется. В современных процессорах и операционных системах точный способ его работы в любом случае очень абстрагирован, поэтому обычно вам не нужно сильно беспокоиться о том, как он работает в глубине, за исключением того, что (в языках, где это позволяет) вы не должны использовать память, которая Вы еще не распределили или память, которую вы освободили.

  • Что делает быстрее?

    Стек быстрее, потому что вся свободная память всегда смежна. Не нужно поддерживать список всех сегментов свободной памяти, только один указатель на текущую вершину стека. Для этого компиляторы обычно хранят этот указатель в специальном быстром регистре . Более того, последующие операции над стеком обычно сосредоточены в очень близких областях памяти, что на очень низком уровне хорошо для оптимизации кэш-памятью процессора.


20
Дэвид: Я не согласен с тем, что это хороший имидж или что «стек пуш-ап» - хороший термин для иллюстрации концепции. Когда вы добавляете что-либо в стек, другое содержимое стека не сдвигается вниз, оно остается на своем месте .
Томасруттер

8
Этот ответ включает в себя большую ошибку. Статические переменные не размещаются в стеке. См. Мой ответ [ссылка] stackoverflow.com/a/13326916/1763801 для уточнения. Вы приравниваете «автоматические» переменные к «статическим» переменным, но они совсем не одинаковы
davec

13
В частности, вы говорите, что «статически размещенные локальные переменные» размещаются в стеке. На самом деле они расположены в сегменте данных. Только автоматически распределенные переменные (которые включают в себя большинство, но не все локальные переменные, а также такие вещи, как параметры функции, передаваемые по значению, а не по ссылке), размещаются в стеке.
Давец

9
Я только что понял, что вы правы - в C статическое распределение - это отдельная вещь, а не термин для всего, что не является динамическим . Я отредактировал свой ответ, спасибо.
Томасруттер

5
Это не просто C. Java, Pascal, Python и многие другие имеют понятия статическое и автоматическое, а не динамическое распределение. Сказать «статическое распределение» означает везде одно и то же. Ни в одном языке статическое распределение не означает «не динамический». Вы хотите термин «автоматическое» распределение для того, что вы описываете (то есть вещи в стеке).
Давец

727

(Я переместил этот ответ из другого вопроса, который был более или менее обманчивым.)

Ответ на ваш вопрос зависит от конкретной реализации и может варьироваться в зависимости от компилятора и архитектуры процессора. Однако вот упрощенное объяснение.

  • И стек, и куча являются областями памяти, выделенными из базовой операционной системы (часто это виртуальная память, которая отображается по требованию на физическую память).
  • В многопоточной среде каждый поток будет иметь свой собственный полностью независимый стек, но они будут совместно использовать кучу. Параллельный доступ должен контролироваться в куче и невозможен в стеке.

Куча

  • Куча содержит связанный список используемых и свободных блоков. Новые выделения в куче (по newили malloc) выполняются путем создания подходящего блока из одного из свободных блоков. Это требует обновления списка блоков в куче. Эта мета информация о блоках в куче также хранится в куче, часто в небольшой области перед каждым блоком.
  • По мере роста кучи новые блоки часто распределяются от более низких адресов к более высоким адресам. Таким образом, вы можете думать о куче как о куче блоков памяти, которые увеличиваются в размере по мере выделения памяти. Если куча слишком мала для выделения, ее размер часто можно увеличить, получая больше памяти из базовой операционной системы.
  • Выделение и освобождение многих маленьких блоков может оставить кучу в состоянии, когда между используемыми блоками расположено много маленьких свободных блоков. Запрос на выделение большого блока может потерпеть неудачу, поскольку ни один из свободных блоков не является достаточно большим, чтобы удовлетворить запрос на выделение, даже если объединенный размер свободных блоков может быть достаточно большим. Это называется фрагментация кучи .
  • Когда используемый блок, который смежен со свободным блоком, освобожден, новый свободный блок может быть объединен со смежным свободным блоком, чтобы создать больший свободный блок, эффективно уменьшающий фрагментацию кучи.

Куча

Стек

  • Стек часто работает в тесном тандеме со специальным регистром на процессоре, называемым указателем стека . Первоначально указатель стека указывает на вершину стека (самый высокий адрес в стеке).
  • Процессор имеет специальные инструкции для толкая значения в стек и выскакивают их из стека. Каждое нажатие сохраняет значение в текущем местоположении указателя стека и уменьшает указатель стека. поп извлекает значение , на которое указывает указатель стека , а затем увеличивает указатель стека (не следует путать с тем , что при добавлении значения в стек уменьшает указатель стека и удаление значение увеличивается его. Помните , что стек растет дно). Сохраненные и извлеченные значения являются значениями регистров ЦП.
  • Когда функция вызывается, CPU использует специальные инструкции, которые выдвигают указатель текущей инструкции , то есть адрес кода, выполняемого в стеке. Затем процессор переходит к функции, устанавливая указатель инструкции на адрес вызываемой функции. Позже, когда функция возвращается, старый указатель команды извлекается из стека, и выполнение возобновляется в коде сразу после вызова функции.
  • Когда функция вводится, указатель стека уменьшается, чтобы выделить больше места в стеке для локальных (автоматических) переменных. Если функция имеет одну локальную 32-битную переменную, в стеке выделяются четыре байта. Когда функция возвращается, указатель стека перемещается назад, чтобы освободить выделенную область.
  • Если функция имеет параметры, они помещаются в стек перед вызовом функции. Затем код в функции может перемещаться вверх по стеку от текущего указателя стека, чтобы найти эти значения.
  • Вызов функции вложенности работает как шарм. Каждый новый вызов будет выделять параметры функции, адрес возврата и пространство для локальных переменных, и эти записи активации могут быть сложены для вложенных вызовов и будут корректно разматываться при возврате функций.
  • Поскольку стек является ограниченным блоком памяти, вы можете вызвать переполнение стека , вызвав слишком много вложенных функций и / или выделив слишком много места для локальных переменных. Часто область памяти, используемая для стека, настраивается таким образом, что запись ниже дна (самый низкий адрес) стека вызовет ловушку или исключение в ЦП. Это исключительное условие может быть перехвачено средой выполнения и преобразовано в некое исключение переполнения стека.

Стек

Может ли функция быть размещена в куче вместо стека?

Нет, записи активации для функций (то есть локальных или автоматических переменных) размещаются в стеке, который используется не только для хранения этих переменных, но и для отслеживания вызовов вложенных функций.

То, как управляется куча, зависит от среды выполнения. C использует mallocи C ++ использует new, но многие другие языки имеют сборку мусора.

Однако стек является более низкоуровневой функцией, тесно связанной с архитектурой процессора. Растить кучу, когда не хватает места, не так уж сложно, так как это может быть реализовано в вызове библиотеки, которая обрабатывает кучу. Однако увеличение стека часто невозможно, так как переполнение стека обнаруживается только тогда, когда это слишком поздно; и закрытие потока выполнения - единственно возможный вариант.


35
@Martin - очень хороший ответ / объяснение, чем более абстрактный принятый ответ. Пример программы сборки, показывающий указатели / регистры стека, используемые для вызовов функций vis, будет более наглядным.
Бикал Лем

3
Каждый ссылочный тип является композицией типов значений (int, string и т. Д.). Как уже говорилось, эти типы значений хранятся в стеке, чем, как это работает, когда они являются частью ссылочного типа.
Nps

15
Этот ответ был лучшим на мой взгляд, потому что он помог мне понять, что на самом деле является оператором возврата и как он связан с этим «адресом возврата», с которым я сталкиваюсь время от времени, что означает помещать функцию в стек, и почему функции помещаются в стеки. Отличный ответ!
Алекс

3
На мой взгляд, это лучшее, а именно упоминание о том, что куча / стек сильно зависят от реализации. Другие ответы предполагают многое о языке и среде / ОС. +1
Qix - МОНИКА БЫЛА ПОВРЕЖДЕНА

2
Что вы имеете в виду «Код в функции затем может перемещаться вверх по стеку от текущего указателя стека, чтобы найти эти значения». ? Можете ли вы уточнить это, пожалуйста?
Корай Тугай

404

В следующем коде C #

public void Method1()
{
    int i = 4;
    int y = 2;
    class1 cls1 = new class1();
}

Вот как управляется память

Изображение переменных в стеке

Local Variablesэто должно продолжаться до тех пор, пока вызов функции идет в стек. Куча используется для переменных, время жизни которых мы на самом деле не знаем заранее, но мы ожидаем, что они будут длиться некоторое время. В большинстве языков очень важно, чтобы мы знали во время компиляции, насколько велика переменная, если мы хотим сохранить ее в стеке.

Объекты (размер которых изменяется по мере их обновления) попадают в кучу, потому что мы не знаем во время создания, как долго они будут длиться. Во многих языках куча мусора собирается для поиска объектов (таких как объект cls1), на которые больше нет ссылок.

В Java большинство объектов попадают прямо в кучу. В таких языках, как C / C ++, структуры и классы часто могут оставаться в стеке, когда вы не имеете дело с указателями.

Более подробную информацию можно найти здесь:

Разница между выделением стека и кучи памяти «timmurphy.org

и здесь:

Создание объектов в стеке и куче

Эта статья является источником изображения выше: Шесть важных концепций .NET: стек, куча, типы значений, ссылочные типы, упаковка и распаковка - CodeProject

но имейте в виду, что это может содержать некоторые неточности.


15
Это неверно i и cls не являются "статическими" переменными. они называются «локальными» или «автоматическими» переменными. Это очень важное различие. См. [Link] stackoverflow.com/a/13326916/1763801 для разъяснения
davec

9
Я не говорил, что они были статическими переменными . Я сказал, что int и cls1 являются статическими элементами . Их память статически распределена, и поэтому они идут в стек. Это в отличие от объекта, который требует динамического выделения памяти, который, следовательно, идет в кучу.
Snowcrash

12
Я цитирую "Статические предметы ... иди в стек". Это просто неправильно. Статические элементы помещаются в сегмент данных, автоматические элементы помещаются в стек.
Давец

14
Кроме того, тот, кто написал эту статью, не знает, о чем говорит. Например, он говорит, что «примитивным нужна статическая память типов», что совершенно не соответствует действительности. Ничто не мешает вам динамически размещать примитивы в куче, просто напишите что-то вроде "int array [] = new int [num]" и вуаля, примитивы, динамически выделяемые в .NET. Это только одна из нескольких неточностей.
Давец

8
Я отредактировал ваше сообщение, потому что вы допустили серьезные технические ошибки в отношении того, что происходит в стеке и куче.
Том Лейс,

209

Стек Когда вы вызываете функцию, в стек помещаются аргументы этой функции и другие накладные расходы. Некоторая информация (например, куда идти по возвращении) также хранится там. Когда вы объявляете переменную внутри вашей функции, эта переменная также размещается в стеке.

Распределение стека довольно просто, потому что вы всегда освобождаете в обратном порядке, в котором вы размещаете. Набор стеков добавляется при вводе функций, соответствующие данные удаляются при выходе из них. Это означает, что вы склонны оставаться в небольшой области стека, если вы не вызываете много функций, которые вызывают множество других функций (или не создаете рекурсивное решение).

Куча Куча - это общее имя для размещения данных, которые вы создаете на лету. Если вы не знаете, сколько космических кораблей собирается создать ваша программа, вы, вероятно, будете использовать оператор new (или malloc или эквивалентный) для создания каждого космического корабля. Это распределение останется на некоторое время, поэтому, скорее всего, мы освободим вещи в другом порядке, чем мы их создали.

Таким образом, куча намного более сложна, потому что в конечном итоге возникают области памяти, которые не используются, чередуются с фрагментами, которые - фрагментация памяти. Поиск свободной памяти нужного вам размера - сложная проблема. Вот почему следует избегать кучи (хотя она все еще часто используется).

Реализация Реализация как стека, так и кучи обычно зависит от времени выполнения / ОС. Часто игры и другие приложения, критически важные для производительности, создают свои собственные решения для памяти, которые захватывают большой кусок памяти из кучи и затем распределяют ее изнутри, чтобы не полагаться на ОС для памяти.

Это практично только в том случае, если использование вашей памяти сильно отличается от нормы - то есть для игр, в которых вы загружаете уровень за одну огромную операцию и можете отбросить все это за другую огромную операцию.

Физическое расположение в памяти Это менее важно, чем вы думаете, из-за технологии, называемой виртуальной памятью, которая заставляет вашу программу думать, что у вас есть доступ к определенному адресу, где физические данные находятся где-то еще (даже на жестком диске!). Адреса, которые вы получаете для стека, растут по мере того, как дерево вызовов становится глубже. Адреса для кучи непредсказуемы (т. Е. Специфичны для имплиментации) и, честно говоря, не важны.


16
Рекомендация избегать использования кучи довольно сильна. Современные системы имеют хорошие диспетчеры кучи, а современные динамические языки широко используют кучу (без особого беспокойства программиста). Я бы сказал, используйте кучу, но с ручным распределителем, не забудьте освободить!
Грег Хьюгилл

2
Если вы можете использовать стек или кучу, используйте стек. Если вы не можете использовать стек, на самом деле нет выбора. Я использую как много, так и, конечно, используя std :: vector или аналогичные хиты. Для новичка вы избегаете кучи, потому что стек просто так просто!
Том Лейс

Если ваш язык не реализует сборку мусора, интеллектуальные указатели (разделенные по отдельности объекты, которые оборачиваются вокруг указателя, который выполняет подсчет ссылок для динамически выделяемых фрагментов памяти), тесно связаны со сборкой мусора и являются достойным способом управления кучей в безопасном и без утечек. Они реализованы в различных средах, но их не так сложно реализовать и для собственных программ.
BenPen

1
«Вот почему следует избегать кучи (хотя она все еще часто используется)». Я не уверен, что это означает на практике, тем более что во многих языках высокого уровня память управляется по-разному. Поскольку этот вопрос помечен как независимый от языка, я бы сказал, что этот конкретный комментарий / строка неуместен и неприменим.
LintfordPickle

2
Хороший вопрос @JonnoHampson - Хотя вы делаете правильное замечание, я бы сказал, что если вы работаете на «языке высокого уровня» с GC, вы, вероятно, не заботитесь о механизмах выделения памяти - и поэтому не стоит даже все равно, что стек и куча.
Том Лейс

194

Чтобы уточнить, этот ответ имеет неверную информацию ( Томас исправил свой ответ после комментариев, круто :)). Другие ответы просто не объясняют, что означает статическое распределение. Поэтому ниже я объясню три основных формы распределения и их связь с кучей, стеком и сегментом данных. Я также покажу некоторые примеры на C / C ++ и Python, чтобы помочь людям понять.

«Статические» (статически распределенные AKA) переменные не размещаются в стеке. Не думайте так - многие люди делают это только потому, что «статический» звук очень похож на «стек». Они на самом деле не существуют ни в стеке, ни в куче. Являются частью того, что называется сегментом данных .

Тем не менее, как правило, лучше учитывать " объем " и " срок службы », а не «стек» и «куча».

Область действия относится к тому, какие части кода могут обращаться к переменной. Обычно мы думаем о локальной области действия (доступ к которой может получить только текущая функция) в сравнении с глобальной областью действия (можно получить доступ в любом месте), хотя область действия может стать намного более сложной.

Время жизни относится к тому, когда переменная выделяется и освобождается во время выполнения программы. Обычно мы думаем о статическом распределении (переменная будет сохраняться в течение всей продолжительности программы, что делает ее полезной для хранения одной и той же информации при нескольких вызовах функций) в сравнении с автоматическим распределением (переменная сохраняется только во время одного вызова функции, что делает ее полезной для хранение информации, которая используется только во время вашей функции и может быть отброшена, когда вы закончите) в сравнении с динамическим распределением (переменные, продолжительность которых определяется во время выполнения, а не во время компиляции, как статические или автоматические).

Хотя большинство компиляторов и интерпретаторов реализуют это поведение аналогично с точки зрения использования стеков, куч и т. Д., Компилятор может иногда нарушать эти соглашения, если он хочет, пока поведение корректно. Например, из-за оптимизации локальная переменная может существовать только в регистре или может быть полностью удалена, даже если большинство локальных переменных существует в стеке. Как было отмечено в нескольких комментариях, вы можете свободно реализовать компилятор, который даже не использует стек или кучу, а вместо этого использует некоторые другие механизмы хранения (редко делается, поскольку стеки и кучи отлично подходят для этого).

Я приведу простой аннотированный C-код для иллюстрации всего этого. Лучший способ научиться - это запускать программу под отладчиком и наблюдать за ее поведением. Если вы предпочитаете читать Python, перейдите к концу ответа :)

// Statically allocated in the data segment when the program/DLL is first loaded
// Deallocated when the program/DLL exits
// scope - can be accessed from anywhere in the code
int someGlobalVariable;

// Statically allocated in the data segment when the program is first loaded
// Deallocated when the program/DLL exits
// scope - can be accessed from anywhere in this particular code file
static int someStaticVariable;

// "someArgument" is allocated on the stack each time MyFunction is called
// "someArgument" is deallocated when MyFunction returns
// scope - can be accessed only within MyFunction()
void MyFunction(int someArgument) {

    // Statically allocated in the data segment when the program is first loaded
    // Deallocated when the program/DLL exits
    // scope - can be accessed only within MyFunction()
    static int someLocalStaticVariable;

    // Allocated on the stack each time MyFunction is called
    // Deallocated when MyFunction returns
    // scope - can be accessed only within MyFunction()
    int someLocalVariable;

    // A *pointer* is allocated on the stack each time MyFunction is called
    // This pointer is deallocated when MyFunction returns
    // scope - the pointer can be accessed only within MyFunction()
    int* someDynamicVariable;

    // This line causes space for an integer to be allocated in the heap
    // when this line is executed. Note this is not at the beginning of
    // the call to MyFunction(), like the automatic variables
    // scope - only code within MyFunction() can access this space
    // *through this particular variable*.
    // However, if you pass the address somewhere else, that code
    // can access it too
    someDynamicVariable = new int;


    // This line deallocates the space for the integer in the heap.
    // If we did not write it, the memory would be "leaked".
    // Note a fundamental difference between the stack and heap
    // the heap must be managed. The stack is managed for us.
    delete someDynamicVariable;

    // In other cases, instead of deallocating this heap space you
    // might store the address somewhere more permanent to use later.
    // Some languages even take care of deallocation for you... but
    // always it needs to be taken care of at runtime by some mechanism.

    // When the function returns, someArgument, someLocalVariable
    // and the pointer someDynamicVariable are deallocated.
    // The space pointed to by someDynamicVariable was already
    // deallocated prior to returning.
    return;
}

// Note that someGlobalVariable, someStaticVariable and
// someLocalStaticVariable continue to exist, and are not
// deallocated until the program exits.

Особенно острым примером того, почему важно различать время жизни и область видимости, является то, что переменная может иметь локальную область видимости, но статическое время жизни - например, «someLocalStaticVariable» в приведенном выше примере кода. Такие переменные могут сделать наши общие, но неформальные привычки именования очень запутанными. Например, когда мы говорим « локально », мы обычно имеем в виду « локально распределенную переменную с автоматическим распределением », а когда мы говорим «глобально», мы обычно имеем в виду « глобально ограниченную статически распределенную переменную ». К сожалению, когда речь заходит о таких вещах, как « статически распределенные переменные в области видимости файлов », многие люди просто говорят… « да ??? ».

Некоторые из вариантов синтаксиса в C / C ++ усугубляют эту проблему - например, многие люди думают, что глобальные переменные не являются «статическими» из-за синтаксиса, показанного ниже.

int var1; // Has global scope and static allocation
static int var2; // Has file scope and static allocation

int main() {return 0;}

Обратите внимание, что добавление ключевого слова «static» в объявлении выше предотвращает глобальную область видимости var2. Тем не менее, глобальное var1 имеет статическое размещение. Это не интуитивно понятно! По этой причине я стараюсь никогда не использовать слово «статический» при описании области действия, а вместо этого говорю что-то вроде «файл» или «ограниченный файл» область. Однако многие люди используют фразу «статический» или «статический объем» для описания переменной, доступ к которой возможен только из одного файла кода. В контексте времени жизни «статический» всегда означает, что переменная выделяется при запуске программы и освобождается при выходе из программы.

Некоторые люди считают эти понятия специфичными для C / C ++. Они не. Например, приведенный ниже пример Python иллюстрирует все три типа размещения (в интерпретируемых языках возможны некоторые тонкие различия, о которых я не буду здесь говорить).

from datetime import datetime

class Animal:
    _FavoriteFood = 'Undefined' # _FavoriteFood is statically allocated

    def PetAnimal(self):
        curTime = datetime.time(datetime.now()) # curTime is automatically allocatedion
        print("Thank you for petting me. But it's " + str(curTime) + ", you should feed me. My favorite food is " + self._FavoriteFood)

class Cat(Animal):
    _FavoriteFood = 'tuna' # Note since we override, Cat class has its own statically allocated _FavoriteFood variable, different from Animal's

class Dog(Animal):
    _FavoriteFood = 'steak' # Likewise, the Dog class gets its own static variable. Important to note - this one static variable is shared among all instances of Dog, hence it is not dynamic!


if __name__ == "__main__":
    whiskers = Cat() # Dynamically allocated
    fido = Dog() # Dynamically allocated
    rinTinTin = Dog() # Dynamically allocated

    whiskers.PetAnimal()
    fido.PetAnimal()
    rinTinTin.PetAnimal()

    Dog._FavoriteFood = 'milkbones'
    whiskers.PetAnimal()
    fido.PetAnimal()
    rinTinTin.PetAnimal()

# Output is:
# Thank you for petting me. But it's 13:05:02.255000, you should feed me. My favorite food is tuna
# Thank you for petting me. But it's 13:05:02.255000, you should feed me. My favorite food is steak
# Thank you for petting me. But it's 13:05:02.255000, you should feed me. My favorite food is steak
# Thank you for petting me. But it's 13:05:02.255000, you should feed me. My favorite food is tuna
# Thank you for petting me. But it's 13:05:02.255000, you should feed me. My favorite food is milkbones
# Thank you for petting me. But it's 13:05:02.256000, you should feed me. My favorite food is milkbones

Я бы сослался на статическую переменную, объявленную внутри функции как имеющую только локальную доступность , но, как правило, не использовал бы термин «область действия» с ней. Кроме того, возможно, стоит отметить, что один аспект стека / кучи, с которым языки имеют практически нулевую гибкость: язык, который сохраняет контекст выполнения в стеке, не может использовать тот же стек для хранения вещей, которые должны будут переживать контексты, в которых они созданы. , Некоторые языки, например, PostScriptимеют несколько стеков, но имеют «кучу», которая ведет себя больше как стек.
суперкат

@supercat Это все имеет смысл. Я определил область видимости как «какие части кода могут обращаться к переменной» (и считаю, что это наиболее стандартное определение), поэтому я думаю, что мы согласны :)
davec

Я бы расценил «область» переменной как ограниченную временем и пространством. Переменная в области видимости объекта класса должна содержать свое значение, пока объект существует. Переменная внутри контекста контекста выполнения должна содержать свое значение, пока выполнение остается в этом контексте. Объявление статической переменной создает идентификатор , область действия которого ограничена текущим блоком, который присоединяется к переменной , область действия которой не ограничена.
Суперкат

@supercat Вот почему я использую слово время жизни, как я называю то, что вы называете временем. Это уменьшает необходимость перегружать слово «охват» таким большим количеством значений. Насколько я могу судить, по-видимому, нет полного консенсуса относительно точных определений, даже среди канонических источников. Моя терминология взята частично из K & R и частично из преобладающего использования на первом отделении CS, в котором я учился / преподавал. Всегда приятно услышать другое осознанное мнение.
davec

1
ты, наверное, шутишь. Вы действительно можете определить статическую переменную внутри функции?
Заим Саттар

168

Другие довольно хорошо ответили на широкие удары, поэтому я добавлю несколько деталей.

  1. Стек и куча не обязательно должны быть единичными. Распространенная ситуация, когда у вас есть более одного стека, если у вас есть более одного потока в процессе. В этом случае каждый поток имеет свой собственный стек. Вы также можете иметь более одной кучи, например, некоторые конфигурации DLL могут приводить к тому, что разные DLL распределяются из разных куч, поэтому обычно плохая идея освобождать память, выделенную другой библиотекой.

  2. В C вы можете получить выгоду от распределения переменной длины за счет использования alloca , которая выделяет в стеке, в отличие от alloc, которая выделяет в куче. Эта память не выдержит вашего оператора return, но она полезна для чистого буфера.

  3. Создание огромного временного буфера в Windows, который вы не используете, не является бесплатным. Это связано с тем, что компилятор будет генерировать цикл проверки стека, который вызывается каждый раз при вводе вашей функции, чтобы убедиться, что стек существует (поскольку Windows использует одну защитную страницу в конце стека для определения того, когда ему нужно увеличить стек. Если вы обращаетесь к памяти более чем на одну страницу с конца стека, вы потерпите крах). Пример:

void myfunction()
{
   char big[10000000];
   // Do something that only uses for first 1K of big 99% of the time.
}

Re "в отличие от alloc": Вы имеете в виду "в отличие от malloc"?
Питер Мортенсен

Насколько портативный alloca?
Питер Мортенсен

@PeterMortensen это не POSIX, переносимость не гарантируется.
Дон Нойфельд

135

Другие прямо ответили на ваш вопрос, но, пытаясь понять стек и кучу, я думаю, что полезно рассмотреть структуру памяти традиционного процесса UNIX (без потоков и mmap()распределителей на основе). Управление памятью Глоссарий веб - страница имеет диаграмму этой схемы памяти.

Стек и куча традиционно расположены на противоположных концах виртуального адресного пространства процесса. При доступе к стеку размер автоматически увеличивается до размера, установленного ядром (который можно настроить с помощью setrlimit(RLIMIT_STACK, ...)). Куча увеличивается, когда распределитель памяти вызывает системный вызов brk()или sbrk(), отображая больше страниц физической памяти в виртуальное адресное пространство процесса.

В системах без виртуальной памяти, таких как некоторые встроенные системы, часто применяется одна и та же базовая схема, за исключением того, что размер стека и кучи фиксирован. Однако в других встроенных системах (например, основанных на микроконтроллерах PIC от Microchip) программный стек представляет собой отдельный блок памяти, который не адресуется инструкциями перемещения данных, и может быть изменен или прочитан только косвенно с помощью инструкций потока программы (вызов, возврат и т. д.). Другие архитектуры, такие как процессоры Intel Itanium, имеют несколько стеков . В этом смысле стек является элементом архитектуры ЦП.


117

Что такое стек?

Стек - это куча объектов, обычно аккуратно расположенных.

Введите описание изображения здесь

Стеки в вычислительных архитектурах - это области памяти, в которые данные добавляются или удаляются в порядке поступления.
В многопоточном приложении каждый поток будет иметь свой собственный стек.

Что такое куча?

Куча - это неопрятная коллекция беспорядочно скопившихся вещей.

Введите описание изображения здесь

В вычислительных архитектурах куча - это область динамически выделяемой памяти, которая автоматически управляется операционной системой или библиотекой диспетчера памяти.
Память в куче выделяется, освобождается и регулярно изменяется во время выполнения программы, и это может привести к проблеме, называемой фрагментацией.
Фрагментация происходит, когда объектам памяти выделяются небольшие промежутки между ними, которые слишком малы для хранения дополнительных объектов памяти.
Чистый результат представляет собой процент пространства кучи, который не может использоваться для дальнейшего выделения памяти.

Оба вместе

В многопоточном приложении каждый поток будет иметь свой собственный стек. Но все разные потоки будут разделять кучу.
Поскольку разные потоки совместно используют кучу в многопоточном приложении, это также означает, что должна быть некоторая координация между потоками, чтобы они не пытались получить доступ и манипулировать одними и теми же частями памяти в куче в в то же время.

Что быстрее - стек или куча? И почему?

Стек намного быстрее, чем куча.
Это связано с тем, как память выделяется в стеке.
Выделение памяти в стеке так же просто, как перемещение указателя стека вверх.

Для новичков в программировании, вероятно, будет хорошей идеей использовать стек, поскольку он проще.
Поскольку стек небольшой, его можно использовать, когда вы точно знаете, сколько памяти вам понадобится для ваших данных, или если вы знаете, что размер ваших данных очень мал.
Лучше использовать кучу, когда вы знаете, что вам понадобится много памяти для ваших данных, или вы просто не уверены, сколько памяти вам понадобится (например, с динамическим массивом).

Модель памяти Java

Введите описание изображения здесь

Стек - это область памяти, в которой хранятся локальные переменные (включая параметры метода). Когда дело доходит до переменных объекта, это всего лишь ссылки (указатели) на реальные объекты в куче.
Каждый раз, когда создается экземпляр объекта, часть памяти кучи откладывается для хранения данных (состояния) этого объекта. Поскольку объекты могут содержать другие объекты, некоторые из этих данных могут фактически содержать ссылки на эти вложенные объекты.


115

Стек - это часть памяти, которой можно манипулировать с помощью нескольких инструкций языка ассемблера, таких как «pop» (удалить и вернуть значение из стека) и «push» (передать значение в стек), но также вызвать ( вызвать подпрограмму - это толкает адрес для возврата в стек) и return (возврат из подпрограммы - это извлекает адрес из стека и переходит к нему). Это область памяти ниже регистра указателя стека, который может быть установлен по мере необходимости. Стек также используется для передачи аргументов подпрограммам, а также для сохранения значений в регистрах перед вызовом подпрограмм.

Куча - это часть памяти, которая предоставляется приложению операционной системой, обычно через системный вызов типа malloc. В современных ОС эта память представляет собой набор страниц, к которым имеет доступ только вызывающий процесс.

Размер стека определяется во время выполнения и, как правило, не увеличивается после запуска программы. В программе на Си стек должен быть достаточно большим, чтобы вместить каждую переменную, объявленную внутри каждой функции. Куча будет динамически расти по мере необходимости, но ОС в конечном итоге сделает вызов (она часто будет увеличивать кучу больше, чем запрашивает malloc, так что по крайней мере некоторым будущим malloc не придется возвращаться к ядру для получить больше памяти. Такое поведение часто настраивается)

Поскольку вы выделили стек перед запуском программы, вам никогда не понадобится malloc, прежде чем вы сможете использовать стек, так что это небольшое преимущество. На практике очень трудно предсказать, что будет быстрым, а что медленным, в современных операционных системах с подсистемами виртуальной памяти, потому что то, как страницы реализованы и где они хранятся, является деталью реализации.


2
Также стоит упомянуть, что Intel сильно оптимизирует доступ к стеку, особенно такие вещи, как прогнозирование места возврата из функции.
Том Лейс

113

Я думаю, что многие другие люди дали вам в основном правильные ответы по этому вопросу.

Одна деталь, которая была упущена, однако, состоит в том, что «куча» на самом деле должна, вероятно, называться «бесплатным магазином». Причина этого различия заключается в том, что исходное бесплатное хранилище было реализовано со структурой данных, известной как «биноминальная куча». По этой причине выделение из ранних реализаций malloc () / free () было выделением из кучи. Однако в наши дни большинство бесплатных магазинов реализованы с очень сложными структурами данных, которые не являются биномиальными кучами.


8
Другой случай - большинство ответов (слегка) подразумевают, что Cязык требует использования «стека» . Это распространенное заблуждение, хотя это (безусловно) доминирующая парадигма для реализации C99 6.2.4 automatic storage duration objects(переменных). На самом деле, слово «стек» даже не встречается в C99языковом стандарте: open-std.org/JTC1/SC22/WG14/www/docs/n1256.pdf
johne

[@Heath] У меня есть небольшой комментарий к вашему ответу. Посмотрите на принятый ответ на этот вопрос . Это говорит о том, что бесплатный магазин, скорее всего , такой же, как куча , хотя и не обязательно.
ОмарОтман

91

Вы можете делать некоторые интересные вещи со стеком. Например, у вас есть такие функции, как alloca (при условии, что вы можете обойти обильные предупреждения, касающиеся его использования), которая является формой malloc, которая специально использует стек, а не кучу памяти.

Тем не менее, ошибки памяти на основе стека являются одними из худших, которые я испытал. Если вы используете кучную память и выходите за границы выделенного блока, у вас есть хороший шанс вызвать ошибку сегмента. (Не 100%: ваш блок может быть случайно смежным с другим, который вы ранее разместили.) Но так как переменные, созданные в стеке, всегда смежны друг с другом, выписывание границ может изменить значение другой переменной. Я узнал, что всякий раз, когда я чувствую, что моя программа перестала подчиняться законам логики, это, вероятно, переполнение буфера.


Насколько портативный alloca? Например, это работает на Windows? Это только для Unix-подобных операционных систем?
Питер Мортенсен

89

Просто в стеке создаются локальные переменные. Кроме того, каждый раз, когда вы вызываете подпрограмму, счетчик программы (указатель на следующую машинную инструкцию) и любые важные регистры, а иногда и параметры помещаются в стек. Затем любые локальные переменные внутри подпрограммы помещаются в стек (и используются оттуда). Когда подпрограмма заканчивается, все эти вещи возвращаются из стека. ПК и регистр данных получаются и возвращаются туда, где они были, как сейчас, чтобы ваша программа могла идти своим путем.

Куча - это область динамического выделения памяти (явные вызовы «new» или «allocate»). Это специальная структура данных, которая может отслеживать блоки памяти разных размеров и их статус распределения.

В «классических» системах ОЗУ было расположено так, что указатель стека начинался с нижней части памяти, указатель кучи начинался сверху, и они росли друг к другу. Если они перекрываются, у вас недостаточно оперативной памяти. Это не работает с современными многопоточными ОС, хотя. Каждый поток должен иметь свой собственный стек, и они могут создаваться динамически.


[@TED] Почему вы сказали «иногда параметры помещаются в стек»? Что я знаю, так это то, что они всегда есть. Не могли бы вы рассказать подробнее?
ОмарОтман

1
@ OmarOthman - я говорю это, потому что все зависит от автора вашего компилятора / интерпретатора, что происходит, когда вызывается подпрограмма. Классическое поведение Фортрана - не использовать стек вообще. Некоторые языки поддерживают такие экзотические вещи, как передача по имени, которая фактически является текстовой заменой.
TED

83

Из WikiAnwser.

стек

Когда функция или метод вызывает другую функцию, которая, в свою очередь, вызывает другую функцию и т. Д., Выполнение всех этих функций приостанавливается до тех пор, пока самая последняя функция не вернет свое значение.

Эта цепочка приостановленных вызовов функций является стеком, поскольку элементы в стеке (вызовы функций) зависят друг от друга.

Стек важно учитывать при обработке исключений и выполнении потоков.

отвал

Куча - это просто память, используемая программами для хранения переменных. Элемент кучи (переменные) не имеет зависимостей друг от друга и всегда может быть доступен случайным образом в любое время.


«Мне больше нравится принятый ответ, так как он еще ниже». Это плохо, не хорошо.
Гонки

54

стек

  • Очень быстрый доступ
  • Не нужно явно перераспределять переменные
  • Процессор эффективно управляет пространством, память не фрагментируется
  • Только локальные переменные
  • Ограничение на размер стека (в зависимости от ОС)
  • Переменные не могут быть изменены

отвал

  • Переменные могут быть доступны по всему миру
  • Нет ограничений на объем памяти
  • (Относительно) медленный доступ
  • Не гарантируется эффективное использование пространства, память может фрагментироваться со временем, так как блоки памяти выделяются, а затем освобождаются
  • Вы должны управлять памятью (вы отвечаете за распределение и освобождение переменных)
  • Размер переменных можно изменить с помощью realloc ()

50

ОК, просто и в двух словах, они означают упорядоченный, а не заказанный ...!

Стек : В элементах стека вещи оказываются друг на друге, что означает, что они будут быстрее и эффективнее обрабатываться! ...

Таким образом, всегда есть индекс, указывающий на конкретный элемент, также обработка будет быстрее, также есть связь между элементами! ...

Куча : нет порядка, обработка будет медленнее, а значения перепутаны без какого-либо определенного порядка или индекса ... есть случайные и нет никакой связи между ними ... поэтому время выполнения и использования может варьироваться ...

Я также создаю изображение ниже, чтобы показать, как они могут выглядеть:

введите описание изображения здесь


49

Короче говоря

Стек используется для статического выделения памяти и куча для динамического выделения памяти, которые хранятся в оперативной памяти компьютера.


В деталях

Стек

Стек представляет собой структуру данных «LIFO» (последний пришел, первый вышел), которая управляется и оптимизируется центральным процессором довольно близко. Каждый раз, когда функция объявляет новую переменную, она «помещается» в стек. Затем каждый раз при выходе из функции все переменные, помещаемые в стек этой функцией, освобождаются (то есть они удаляются). После освобождения переменной стека эта область памяти становится доступной для других переменных стека.

Преимущество использования стека для хранения переменных заключается в том, что память управляется за вас. Вам не нужно выделять память вручную или освобождать ее, если она вам больше не нужна. Более того, поскольку процессор эффективно организует стековую память, чтение и запись в переменные стека происходит очень быстро.

Больше можно найти здесь .


Куча

Куча - это область памяти вашего компьютера, которая не управляется автоматически и не так жестко управляется процессором. Это более свободно плавающая область памяти (и больше). Чтобы выделить память в куче, вы должны использовать malloc () или calloc (), которые являются встроенными функциями C. После выделения памяти в куче вы несете ответственность за использование free () для освобождения этой памяти, когда она вам больше не нужна.

Если вы этого не сделаете, ваша программа будет иметь то, что известно как утечка памяти. То есть память в куче все равно будет выделена (и не будет доступна другим процессам). Как мы увидим в разделе отладки, есть инструмент под названием Valgrind, который может помочь вам обнаружить утечки памяти.

В отличие от стека, куча не имеет ограничений по размеру переменного размера (кроме очевидных физических ограничений вашего компьютера). Память кучи немного медленнее для чтения и записи, потому что для доступа к памяти в куче нужно использовать указатели. Мы поговорим об указателях в ближайшее время.

В отличие от стека, переменные, созданные в куче, доступны любой функции в любой точке вашей программы. Переменные кучи по сути являются глобальными.

Больше можно найти здесь .


Переменные, размещенные в стеке, сохраняются непосредственно в памяти, и доступ к этой памяти очень быстрый, и его распределение решается при компиляции программы. Когда функция или метод вызывает другую функцию, которая, в свою очередь, вызывает другую функцию и т. Д., Выполнение всех этих функций приостанавливается до тех пор, пока самая последняя функция не вернет свое значение. Стек всегда резервируется в порядке LIFO, последний зарезервированный блок всегда является следующим блоком, который должен быть освобожден. Это действительно упрощает отслеживание стека, освобождение блока из стека - всего лишь настройка одного указателя.

Переменным, выделенным в куче, выделяется память во время выполнения, и доступ к этой памяти немного медленнее, но размер кучи ограничен только размером виртуальной памяти. Элементы кучи не имеют зависимостей друг от друга и всегда могут быть доступны случайным образом в любое время. Вы можете выделить блок в любое время и освободить его в любое время. Это значительно усложняет отслеживание того, какие части кучи выделены или свободны в любой момент времени.

Введите описание изображения здесь

Вы можете использовать стек, если точно знаете, сколько данных вам нужно выделить до компиляции, и он не слишком велик. Вы можете использовать кучу, если вы точно не знаете, сколько данных вам потребуется во время выполнения или если вам нужно выделить много данных.

В многопоточной ситуации каждый поток будет иметь свой собственный полностью независимый стек, но они будут совместно использовать кучу. Стек зависит от потока, а куча зависит от приложения. Стек важно учитывать при обработке исключений и выполнении потоков.

Каждый поток получает стек, в то время как для приложения обычно есть только одна куча (хотя весьма часто иметь несколько куч для разных типов размещения).

Введите описание изображения здесь

Во время выполнения, если приложению требуется больше кучи, оно может выделить память из свободной памяти, а если стеку требуется память, оно может выделить память из свободной памяти, выделенной для приложения.

Даже более подробно здесь и здесь .


Теперь перейдите к ответам на ваш вопрос .

В какой степени они контролируются ОС или языковой средой выполнения?

ОС выделяет стек для каждого потока системного уровня при его создании. Обычно ОС вызывается языковой средой выполнения для выделения кучи для приложения.

Больше можно найти здесь .

Какова их сфера применения?

Уже дано в топе.

«Вы можете использовать стек, если точно знаете, сколько данных нужно выделить до компиляции, и он не слишком большой. Вы можете использовать кучу, если точно не знаете, сколько данных вам потребуется во время выполнения или если вам нужно выделить много данных. "

Больше можно найти здесь .

От чего зависит размер каждого из них?

Размер стека устанавливается ОС при создании потока. Размер кучи устанавливается при запуске приложения, но может увеличиваться по мере необходимости в пространстве (распределитель запрашивает больше памяти у операционной системы).

Что делает быстрее?

Распределение стека происходит намного быстрее, поскольку все, что он на самом деле делает - это перемещает указатель стека. Используя пулы памяти, вы можете получить сопоставимую производительность за счет распределения кучи, но это связано с небольшой дополнительной сложностью и собственными головными болями.

Кроме того, стек против кучи - это не только вопрос производительности; он также много говорит вам об ожидаемом времени жизни объектов.

Подробности можно найти здесь .


36

В 1980-х годах UNIX распространялся как зайчики, а крупные компании катались самостоятельно. У Exxon был такой же, как и утерянные в истории десятки брендов. То, как память была размещена, оставалось на усмотрение многих разработчиков.

Типичная C-программа была разложена в памяти с возможностью увеличения путем изменения значения brk (). Как правило, HEAP была чуть ниже этого значения brk, а увеличение brk увеличивало количество доступной кучи.

Один STACK обычно представлял собой область ниже HEAP, которая представляла собой участок памяти, не содержащий ничего ценного, до вершины следующего фиксированного блока памяти. Этот следующий блок часто был CODE, который мог быть перезаписан стековыми данными в одном из известных хаков своей эпохи.

Одним типичным блоком памяти был BSS (блок нулевых значений), который случайно не был обнулен в предложении одного производителя. Другой был DATA, содержащий инициализированные значения, включая строки и числа. Третьим был CODE, содержащий CRT (время выполнения C), main, функции и библиотеки.

Появление виртуальной памяти в UNIX меняет многие ограничения. Нет объективной причины, по которой эти блоки должны быть смежными, фиксированными по размеру или заказанными определенным образом. Конечно, до UNIX были Multics, которые не страдали от этих ограничений. Вот схема, показывающая один из макетов памяти той эпохи.

Типичная схема памяти программ в стиле UNIX C в стиле 1980-х годов



26

Пара центов: я думаю, будет хорошо нарисовать память графически и проще:

Это мое видение построения памяти процесса с упрощением для более легкого понимания происходящего


Стрелки - показывают, где растут стек и куча, размер стека процесса имеет ограничение, определенное в ОС, ограничения размера стека потока по параметрам в API создания потока обычно. Обычно размер кучи ограничивается максимальным размером виртуальной памяти процесса, например, для 32-разрядных 2-4 ГБ.

Таким простым способом: куча процесса является общей для процесса и всех потоков внутри, используя для распределения памяти в общем случае что-то вроде malloc () .

Стек - это быстрая память для хранения в общем случае указателей и переменных возврата функций, которые обрабатываются как параметры в вызове функции, локальные переменные функции.


23

Так как некоторые ответы стали придирчивыми, я собираюсь внести свою лепту.

Удивительно, но никто не упомянул, что несколько (то есть не связанных с количеством запущенных потоков на уровне ОС) стеков вызовов можно найти не только в экзотических языках (PostScript) или платформах (Intel Itanium), но также в волокнах , зеленых потоках. и некоторые реализации сопрограмм .

Волокна, зеленые нити и сопрограммы во многом похожи, что приводит к путанице. Разница между волокнами и зелеными нитями заключается в том, что первые используют кооперативную многозадачность, в то время как последние могут иметь либо кооперативную, либо вытесняющую (или даже обе). Различия между волокнами и сопрограммами см. Здесь .

В любом случае, назначение обоих волокон, зеленых нитей и сопрограмм состоит в том, чтобы несколько функций выполнялись одновременно, но не параллельно (см. Этот вопрос в разделе SO ) в пределах одного потока уровня ОС, передавая управление вперед и назад друг от друга. организованно.

При использовании волокон, зеленых нитей или сопрограмм у вас обычно есть отдельный стек для каждой функции. (Технически, для каждой функции используется не просто стек, а целый контекст выполнения. Самое главное, регистры ЦП.) Для каждого потока существует столько стеков, сколько имеется одновременно выполняемых функций, и поток переключается между выполнением каждой функции. в соответствии с логикой вашей программы. Когда функция запускается до конца, ее стек уничтожается. Таким образом, количество и время жизни стеков являются динамическими и не определяются количеством потоков на уровне ОС!

Обратите внимание, что я сказал, что " обычно есть отдельный стек для каждой функции". Там вы оба stackful и Stackless реализации couroutines. Большинство реализаций отличается stackful C ++ являются Boost.Coroutine и Microsoft Закон о госзакупках «s async/await. (Тем не менее, возобновляемые функции C ++ (также называемые « asyncи await»), которые были предложены для C ++ 17, скорее всего будут использовать сопрограммы без стеков.)

Предложение Fibers к стандартной библиотеке C ++ ожидается. Также есть сторонние библиотеки . Зеленые темы чрезвычайно популярны в таких языках, как Python и Ruby.


19

Мне есть чем поделиться, хотя основные моменты уже освещены.

стек

  • Очень быстрый доступ.
  • Хранится в оперативной памяти.
  • Здесь загружаются вызовы функций, а также передаются локальные переменные и параметры функций.
  • Пространство освобождается автоматически, когда программа выходит из области видимости.
  • Хранится в последовательной памяти.

отвал

  • Медленный доступ по сравнению со стеком.
  • Хранится в оперативной памяти.
  • Здесь хранятся динамически создаваемые переменные, что позже потребует освобождения выделенной памяти после использования.
  • Хранится везде, где выполняется выделение памяти, доступ к нему осуществляется всегда по указателю.

Интересная заметка:

  • Если бы вызовы функций были сохранены в куче, это привело бы к двум беспорядочным точкам:
    1. Благодаря последовательному хранению в стеке выполнение выполняется быстрее. Хранение в куче привело бы к огромным затратам времени и замедлению работы всей программы.
    2. Если бы функции хранились в куче (грязное хранилище, на которое указывает указатель), не было бы никакого способа вернуться обратно к адресу вызывающей стороны (который стек дает из-за последовательного хранения в памяти).

1
краткий и чистый. приятно :)
ingconti

13

Вот Это Да! Так много ответов, и я не думаю, что один из них понял это правильно ...

1) Где и что они (физически в памяти реального компьютера)?

Стек - это память, которая начинается с наивысшего адреса памяти, выделенного для образа вашей программы, и затем уменьшается в этом значении. Он зарезервирован для параметров вызываемой функции и для всех временных переменных, используемых в функциях.

Есть две кучи: государственная и частная.

Частная куча начинается с 16-байтовой границы (для 64-битных программ) или 8-байтовой границы (для 32-битных программ) после последнего байта кода в вашей программе, а затем увеличивается в значении оттуда. Это также называется кучей по умолчанию.

Если частная куча становится слишком большой, она перекрывает область стека, как и стек, перекрывающий кучу, если она становится слишком большой. Поскольку стек начинается с более высокого адреса и работает до более низкого адреса, при правильном взломе вы можете сделать стек настолько большим, что он будет переполнять область приватной кучи и перекрывать область кода. Хитрость заключается в том, чтобы перекрыть достаточно области кода, которую вы можете подключить к коду. Это немного сложно сделать, и вы рискуете сбой программы, но это легко и очень эффективно.

Общедоступная куча находится в собственном пространстве памяти за пределами пространства образов вашей программы. Именно эта память будет перекачана на жесткий диск, если ресурсы памяти станут недостаточными.

2) В какой степени они контролируются ОС или языковой средой выполнения?

Стек управляется программистом, частная куча управляется ОС, а общедоступная куча никем не контролируется, потому что это служба ОС - вы делаете запросы, и они либо удовлетворяются, либо отклоняются.

2б) Какова их сфера применения?

Все они являются глобальными для программы, но их содержимое может быть частным, общедоступным или глобальным.

2с) От чего зависит размер каждого из них?

Размер стека и частная куча определяются параметрами времени выполнения вашего компилятора. Общая куча инициализируется во время выполнения с помощью параметра размера.

2d) Что делает быстрее?

Они не предназначены для быстрой работы, они предназначены для того, чтобы быть полезными. То, как их использует программист, определяет, являются ли они «быстрыми» или «медленными»

REF:

https://norasandler.com/2019/02/18/Write-a-Compiler-10.html

https://docs.microsoft.com/en-us/windows/desktop/api/heapapi/nf-heapapi-getprocessheap

https://docs.microsoft.com/en-us/windows/desktop/api/heapapi/nf-heapapi-heapcreate


8

Многие ответы верны как понятия, но мы должны отметить, что аппаратному обеспечению необходим стек (то есть микропроцессор), чтобы разрешить вызов подпрограмм (CALL на ассемблере ..). (ООП ребята будут называть это методами )

В стеке вы сохраняете обратные адреса, а вызов → push / ret → pop управляется напрямую аппаратно.

Вы можете использовать стек для передачи параметров ... даже если он медленнее, чем регистры (скажет гуру микропроцессора или хорошая книга по BIOS 1980-х годов ...)

  • Без стека не может работать ни один микропроцессор. (мы не можем представить программу, даже на ассемблере, без подпрограмм / функций)
  • Без кучи это может. (Программа на языке ассемблера может работать без, так как куча - это понятие ОС, как malloc, то есть вызов OS / Lib.

Использование стека происходит быстрее:

  • Это аппаратное обеспечение, и даже push / pop очень эффективны.
  • malloc требует входа в режим ядра, использования блокировки / семафора (или других примитивов синхронизации), выполнения некоторого кода и управления некоторыми структурами, необходимыми для отслеживания распределения.


Вы хотите сказать, что mallocэто вызов ядра?
Питер Мортенсен

1) да, извините .. ООП ... 2) malloc: я пишу коротко, извините ... malloc находится в пространстве пользователя ... но может инициировать другие вызовы .... суть в том, что использование кучи МОЖЕТ быть очень медленным ...
ingconti

« Многие ответы верны как понятия, но мы должны отметить, что аппаратному обеспечению (т.е. микропроцессору) необходим стек, чтобы разрешить вызывать подпрограммы (CALL на ассемблере ...) ». Вы путаете стек ЦП (если он был в современном ЦП) и стеки времени выполнения языка (по одному на поток). Когда программисты говорят о стеке, это стек выполнения потоков среды выполнения, например стек потоков NET), мы не говорим о стеке ЦП.
минут

1

Стек - это, по сути, легкодоступная память, которая просто управляет своими элементами в виде «хорошего» стека. В стек могут попадать только предметы, размер которых известен заранее . Это касается чисел, строк, логических значений.

Кучи память для элементов которого вы не можете предопределяют точный размер и структуру . Поскольку объекты и массивы могут видоизменяться и изменяться во время выполнения, они должны попадать в кучу.

Источник: Академинд


0

Спасибо за действительно хорошее обсуждение, но как настоящий нуб, мне интересно, где хранятся инструкции? В НАЧАЛЕ ученые выбирали между двумя архитектурами (фон Нейманн, где все считается ДАННЫМИ и ГАРВАРД, где область памяти была зарезервирована для инструкций, а другая - для данных). В конечном счете, мы выбрали дизайн фон Неймана, и теперь все считается «одним и тем же». Это мешало мне, когда я изучал сборку https://www.cs.virginia.edu/~evans/cs216/guides/x86.html, потому что они говорят о регистрах и указателях стека.

Все выше говорит о ДАННЫХ. Я предполагаю, что поскольку инструкция - это определенная вещь с определенным объемом памяти, она будет помещаться в стек, и поэтому все «те» регистры, которые обсуждались в сборке, находятся в стеке. Конечно же, тогда появилось объектно-ориентированное программирование с инструкциями и данными, объединенными в динамическую структуру, так что теперь инструкции будут также храниться в куче?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.