Затем будет описана структура данных ядра, которая применяется для представления файловых дескрипторов и открытых файлов. Понимая взаимоотношения между этими структурами, вы сможете разобраться в некоторых тонкостях файлового ввода-вывода, рассматриваемых в последующих главах. На основе этой модели будет объяснен порядок создания дубликатов дескрипторов файлов.
Затем будут перечислены некоторые системные вызовы, предоставляющие расширенные функциональные возможности чтения и записи. Они могут позволить нам выполнять ввод/вывод в конкретном месте файла без изменения файлового смещения и перемещать данные между несколькими буферами в программе.
Кроме того, мы затронем тему концепции неблокируемого ввода-вывода, а также рассмотрим некоторые расширения, предоставляемые для поддержки ввода-вывода в очень больших файлах.
Поскольку многими системными программами используются временные файлы, будут также перечислены некоторые библиотечные функции, позволяющие создавать и использовать временные файлы с произвольно создаваемыми уникальными именами.
С понятием атомарности при рассмотрении операций системных вызовов придется сталкиваться довольно часто. Все системные вызовы выполняются атомарно. Это означает, что ядро гарантирует завершение всех этапов системного вызова в рамках одной операции, которая не прерывается другим процессом или потоком.
Для завершения некоторых операций атомарность играет весьма важную роль. В частности, она позволяет избежать
Далее мы рассмотрим две ситуации, развивающиеся на фоне файлового ввода-вывода, при которых возникает состояние гонки. Вы увидите, как эти состязания устраняются путем использования флагов системного вызова open(), гарантирующего атомарность соответствующих файловых операций.
Мы вернемся к теме состояния гонки, когда приступим к рассмотрению системного вызова sigsuspend() в разделе 22.9 и системного вызова fork() в разделе 24.4.
В подразделе 4.3.1 отмечалось, что указание флага O_EXCL в сочетании с флагом O_CREAT заставляет open() возвращать ошибку, если файл уже существует. Тем самым процессу гарантируется, что именно он является создателем файла. Проводимая заранее проверка существования файла и создание файла выполняются атомарно. Чтобы понять, насколько это важно, рассмотрим код, показанный в листинге 5.1. Мы могли бы им воспользоваться при отсутствии флага O_EXCL. (В этом коде выводится идентификатор процесса, возвращаемый системным вызовом getpid(), позволяющий отличить данные на выходе двух различных запусков этой программы.)
Листинг 5.1. Код, не подходящий для эксклюзивного открытия файла
fd = open(argv[1], O_WRONLY); /* Открытие 1: проверка существования файла */
if (fd!= -1) { /* Открытие прошло успешно */
printf("[PID %ld] File \"%s\" already exists\n",
(long) getpid(), argv[1]);
close(fd);
} else {
if (errno!= ENOENT) { /* Сбой по неожиданной причине */
errExit("open");
} else {
/* ОТРЕЗОК ВРЕМЕНИ НА СБОЙ */
fd = open(argv[1], O_WRONLY | O_CREAT, S_IRUSR | S_IWUSR);
if (fd == -1)
errExit("open");
printf("[PID %ld] Created file \"%s\" exclusively\n",
(long) getpid(), argv[1]); /* МОЖЕТ БЫТЬ ЛОЖЬЮ! */
}
}
Кроме пространного использования двух вызовов open(), код в листинге 5.1 содержит ошибку. Представим себе, что один из наших процессов первым вызвал open(). Файл еще не существовал, но до того, как состоялся второй вызов open(), какой-то другой процесс создал его. Это могло произойти, если диспетчер ядра решил, что отрезок времени, выделенный процессу, истек, и передал управление, как показано на рис. 5.1, другому процессу, или, если два процесса были запущены одновременно в многопроцессорной системе. На рис. 5.1 изображен случай, когда оба таких процесса выполняют код, показанный в листинге 5.1. В данном сценарии процесс А придет к неверному заключению, что файл создан именно им, поскольку второй вызов open() будет успешен независимо от того, существовал файл или нет.
Хотя шанс на заблуждение процесса относительно того, что именно он является создателем файла, относительно мал, сама возможность такого события делает этот код ненадежным. Тот факт, что исход этих операций зависит от порядка диспетчеризации двух процессов, означает, что возникло состояние гонки.