Изменение размеров кучи (то есть выделение и высвобождение памяти) сводится лишь к тому, чтобы всего лишь объяснить ядру, где располагается крайняя точка программы (program break). Изначально крайняя точка программы находится непосредственно сразу же за окончанием сегмента неинициализированных данных (то есть там же, где на рис. 6.1 стоит метка &end). После того как эта точка будет сдвинута вверх, программа сможет получать доступ к любому адресу во вновь выделенной области, но страницы физической памяти пока выделяться не будут. Ядро автоматически выделит новые физические страницы при первой же попытке процесса обратиться к адресам этих страниц.
Традиционно для манипуляций с крайней точкой программы система UNIX предоставляла два системных вызова, и они оба доступны в Linux: brk() и sbrk(). Хотя в программах эти системные вызовы напрямую используются довольно редко, в их работе стоит разобраться, чтобы выяснить порядок выделения памяти.
#include
int brk(void *
Возвращает 0 при успешном завершении или –1 при ошибке
void *sbrk(intptr_t
Возвращает предыдущую крайнюю точку программы при успешном завершении или (void *) –1 при ошибке
Системный вызов brk() устанавливает крайнюю точку программы на место, указанное окончанием сегмента данных — end_data_segment. Поскольку виртуальная память выделяется постранично, end_data_segment фактически округляется до границы следующей страницы.
Попытки установить крайнюю точку программы ниже ее первоначального значения, (то есть ниже метки &end), скорее всего, приведут к неожиданному поведению, например к сбою сегментирования (сигнал SIGSEGV рассматривается в разделе 20.2) при обращении к данным в уже не существующих частях сегментов инициализированных или неинициализированных данных. Точный верхний предел возможной установки крайней точки программы зависит от нескольких факторов, в числе которых: ограничение ресурсов процесса для размера сегмента данных (RLIMIT_DATA, рассматриваемое в разделе 36.3), а также расположение отображений памяти, сегментов совместно используемой памяти и совместно используемых библиотек.
Вызов sbrk() приводит к изменению положения точки программы путем добавления к ней приращения increment. (В Linux функция sbrk() является библиотечной и реализована в виде надстройки над функцией brk().) Используемый для описания приращения increment тип intptr_t является целочисленным типом данных. В случае успеха функция sbrk() возвращает предыдущий адрес крайней точки программы. Иными словами, если мы подняли крайнюю точку программы, то возвращаемым значением будет указатель на начало только что выделенного блока памяти.
Вызов sbrk(0) возвращает текущее значение установки крайней точки программы без ее изменения. Этот вызов может пригодиться, если нужно отследить размер кучи, возможно, чтобы изучить поведение пакета средств выделения памяти.
В SUSv2 имеются описания brk() и sbrk() (с пометкой LEGACY, то есть устаревшие). Из SUSv3 эти описания удалены.
7.1.2. Выделение памяти в куче: malloc() и free()
Обычно в программах на языке C для выделения памяти в куче и ее высвобождения используется семейство функций malloc. Эти функции по сравнению с brk() и sbrk() предоставляют несколько преимуществ. В частности, они:
• стандартизированы в качестве части языка C;
• проще в использовании в программах, выполняемых в нескольких потоках;
• предоставляют простой интерфейс, позволяющий выделять память небольшими блоками;
• позволяют произвольно высвобождать блоки памяти, сохраняемые в списке свободных блоков и заново возвращаемые в оборот при последующих вызовах выделения памяти.
Функция malloc() выделяет из кучи size байтов и возвращает указатель на начало только что выделенного блока памяти. Выделенная память не инициализируется.
#include
void *malloc(size_t
Возвращает при успешном завершении указатель на выделенную память или NULL при ошибке
Поскольку функция malloc() возвращает тип void *, ее можно присваивать любому типу указателя языка C. Блок памяти, возвращенный malloc(), всегда выравнивается по байтовой границе, обеспечиващей эффективное обращение к данным любого типа языка C. На практике это означает, что выделение на большинстве архитектур происходит по 8- или 16-байтовой границе.
В SUSv3 определяется, что вызов malloc(0) может возвращать либо NULL, либо указатель на небольшой фрагмент памяти, который может (и должен быть) высвобожден с помощью функции free(). В Linux вызов malloc(0) придерживается второго варианта поведения.
Если память не может быть выделена (например, по причине достижения того предела, до которого может быть поднята крайняя точка программы), функция malloc() возвращает NULL и устанавливает для errno значение, указывающее на характер ошибки. Хотя сбой при выделении памяти случается редко, все вызовы malloc(), и родственных функций, которые будут рассмотрены далее, должны проверяться на отсутствие этой ошибки.