Текст книги "UNIX: разработка сетевых приложений"
Автор книги: Уильям Ричард Стивенс
Соавторы: Эндрю М. Рудофф,Билл Феннер
Жанр:
ОС и Сети
сообщить о нарушении
Текущая страница: 12 (всего у книги 88 страниц) [доступный отрывок для чтения: 32 страниц]
Сервер, представленный в листинге 4.2, является последовательным (итеративным) сервером. Для такого простого сервера, как сервер времени и даты, это допустимо. Но когда обработка запроса клиента занимает больше времени, мы не можем связывать один сервер с одним клиентом, поскольку нам хотелось бы обрабатывать множество клиентов одновременно. Простейшим способом написать параллельный сервер под Unix является вызов функции fork
, порождающей дочерний процесс для каждого клиента. В листинге 4.3 представлена общая схема типичного параллельного сервера.
Листинг 4.3. Типичный параллельный сервер
pid_t pid;
int listenfd, connfd;
listenfd = Socket( ... );
/* записываем в sockaddr_in{} параметры заранее известного порта сервера */
Bind(listenfd, ... );
Listen(listenfd, LISTENQ);
for (;;) {
connfd = Accept(listenfd, ...); /* вероятно, блокировка */
if ((pid = Fork() == 0) {
Close(listenfd); /* дочерний процесс закрывает
прослушиваемый сокет */
doit(connfd); /* обработка запроса */
Close(connfd); /* с этим клиентом закончено */
exit(0); /* дочерний процесс завершен */
}
Close(connfd); /* родительский процесс закрывает
присоединенный сокет */
}
Когда соединение установлено, функция accept
возвращает управление, сервер вызывает функцию fork
и затем дочерний процесс занимается обслуживанием клиента (по присоединенному сокету connfd
), а родительский процесс ждет другого соединения (на прослушиваемом сокете listenfd
). Родительский процесс закрывает присоединенный сокет, поскольку новый клиент обрабатывается дочерним процессом.
Мы предполагаем, что функция doit
в листинге 4.3 выполняет все, что требуется для обслуживания клиента. Когда эта функция возвращает управление, мы явно закрываем присоединенный сокет с помощью функции close
в дочернем процессе. Делать это не обязательно, так как в следующей строке вызывается exit
, а прекращение процесса подразумевает, в частности, закрытие ядром всех открытых дескрипторов. Включать явный вызов функции close
или нет – дело вкуса программиста.
В разделе 2.6 мы сказали, что вызов функции close
на сокете TCP вызывает отправку сегмента FIN, за которой следует обычная последовательность прекращения соединения TCP. Почему же функция close(connfd)
из листинга 4.3, вызванная родительским процессом, не завершает соединение с клиентом? Чтобы понять происходящее, мы должны учитывать, что у каждого файла и сокета есть счетчик ссылок (reference count). Для счетчика ссылок поддерживается своя запись в таблице файла [110, с. 57–60]. Эта запись содержит значения счетчика дескрипторов, открытых в настоящий момент, которые соответствуют этому файлу или сокету. В листинге 4.3 после завершения функции socket
запись в таблице файлов, связанная с listenfd
, содержит значение счетчика ссылок, равное 1. Но после завершения функции fork
дескрипторы дублируются (для совместного использования и родительским, и дочерним процессом), поэтому записи в таблице файла, ассоциированные с этими сокетами, теперь содержат значение 2. Следовательно, когда родительский процесс закрывает connfd
, счетчик ссылок уменьшается с 2 до 1. Но фактического закрытия дескриптора не произойдет, пока счетчик ссылок не станет равен 0. Это случится несколько позже, когда дочерний процесс закроет connfd
.
Рассмотрим пример, иллюстрирующий листинг 4.3. Прежде всего, на рис. 4.5 показано состояние клиента и сервера в тот момент, когда сервер блокируется при вызове функции accept и от клиента приходит запрос на соединение.
Рис. 4.5. Состояние соединения клиент-сервер перед завершением вызванной функции accept
Сразу же после завершения функции accept
мы получаем сценарий, изображенный на рис. 4.6. Соединение принимается ядром и создается новый сокет – connfd
. Это присоединенный сокет, и теперь данные могут считываться и записываться по этому соединению.
Рис. 4.6. Состояние соединения клиент-сервер после завершения функции accept
Следующим действием параллельного сервера является вызов функции fork
. На рис. 4.7 показано состояние соединения после вызова функции fork
.
Рис. 4.7. Состояние соединения клиент-сервер после вызова функции fork
Обратите внимание, что оба дескриптора listenfd
и connfd
совместно используются родительским и дочерним процессами.
Далее родительский процесс закрывает присоединенный сокет, а дочерний процесс закрывает прослушиваемый сокет. Это показано на рис. 4.8.
Рис. 4.8. Состояние соединения клиент-сервер после закрытия родительским и дочерним процессами соответствующих сокетов
Это и есть требуемое конечное состояние сокетов. Дочерний процесс управляет соединением с клиентом, а родительский процесс может снова вызвать функцию accept
на прослушиваемом сокете, чтобы обрабатывать следующее клиентское соединение.
Обычная функция Unix close
также используется для закрытия сокета и завершения соединения TCP.
#include
int close(int sockfd);
По умолчанию функция close
помечает сокет TCP как закрытый и немедленно возвращает управление процессу. Дескриптор сокета больше не используется процессом и не может быть передан в качестве аргумента функции read
или write
. Но TCP попытается отправить данные, которые уже установлены в очередь, и после их отправки осуществит нормальную последовательность завершения соединения TCP (см. раздел 2.5).
В разделе 7.5 рассказывается о параметре сокета SO_LINGER
, который позволяет нам изменять последовательность закрытия сокета TCP. В этом разделе мы также назовем действия, благодаря которым приложение TCP может получить гарантию того, что приложение-собеседник получило данные, поставленные в очередь на отправку, но еще не отправленные.
В конце раздела 4.8 мы отметили, что когда родительский процесс на нашем параллельном сервере закрывает присоединенный сокет с помощью функции close
, счетчик ссылок дескриптора уменьшается лишь на единицу. Поскольку счетчик ссылок при этом все еще оставался больше нуля, вызов функции close
не инициировал последовательность завершения TCP-соединения, состоящую из четырех пакетов. Нам нужно, чтобы наш параллельный сервер с присоединенным сокетом, разделяемым между родительским и дочерним процессами, работал именно по этому принципу.
Если мы хотим отправить сегмент FIN по соединению TCP, вместо функции close
должна использоваться функция shutdown
(см. раздел 6.6). Причины мы рассмотрим в разделе 6.5.
Необходимо также знать, что происходит с нашим параллельным сервером, если родительский процесс не вызывает функцию close
для каждого присоединенного сокета, возвращаемого функцией accept
. Прежде всего, родительский процесс в какой-то момент израсходует все дескрипторы, поскольку обычно число дескрипторов, которые могут быть открыты процессом, ограничено. Но что более важно, ни одно из клиентских соединений не будет завершено. Когда дочерний процесс закрывает присоединенный сокет, его счетчик ссылок уменьшается с 2 до 1 и остается равным 1, поскольку родительский процесс не закрывает присоединенный сокет с помощью функции close
. Это помешает выполнить последовательность завершения соединения TCP, и соединение останется открытым.
Эти две функции возвращают либо локальный (функция getsockname
), либо удаленный (функция getpeername
) адрес протокола, связанный с сокетом.
#include
int getsockname(int sockfd, struct sockaddr * localaddr,
socklen_t * addrlen);
int getpeername(int sockfd, struct sockaddr * peeraddr,
socklen_t * addrlen);
Обратите внимание, что последний аргумент обеих функций относится к типу «значение-результат», то есть обе функции будут заполнять структуру адреса сокета, на которую указывает аргумент localaddr
или peeraddr
.
ПРИМЕЧАНИЕ
Обсуждая функцию bind, мы отметили, что термин «имя» используется некорректно. Эти две функции возвращают адрес протокола, связанный с одним из концов сетевого соединения, что для протоколов IPv4 и IPv6 является сочетанием IP-адреса и номера порта. Эти функции также не имеют ничего общего с доменными именами (глава 11).
Функции getsockname
и getpeername
необходимы нам по следующим соображениям:
■ После успешного выполнения функции connect
и возвращения управления в клиентский процесс TCP, который не вызывает функцию bind
, функция getsockname
возвращает IP-адрес и номер локального порта, присвоенные соединению ядром.
■ После вызова функции bind
с номером порта 0 (что является указанием ядру на необходимость выбрать номер локального порта) функция getsockname
возвращает номер локального порта, который был задан.
■ Функцию getsockname
можно вызвать, чтобы получить семейство адресов сокета, как это показано в листинге 4.4.
■ Сервер TCP, который с помощью функции bind
связывается с универсальным IP-адресом (см. листинг 1.5), как только устанавливается соединение с клиентом (функция accept
успешно выполнена), может вызвать функцию getsockname
, чтобы получить локальный IP-адрес соединения. Аргумент sockfd
(дескриптор сокета) в этом вызове должен содержать дескриптор присоединенного, а не прослушиваемого сокета.
■ Когда сервер запускается с помощью функции exec
процессом, вызывающим функцию accept
, он может идентифицировать клиента только одним способом – вызвать функцию getpeername
. Это происходит, когда функция inetd
(см. раздел 13.5) вызывает функции fork
и exec
для создания сервера TCP. Этот сценарий представлен на рис. 4.9. Функция inetd
вызывает функцию accept
(верхняя левая рамка), после чего возвращаются два значения: дескриптор присоединенного сокета connfd
(это возвращаемое значение функции), а также IP-адрес и номер порта клиента, отмеченные на рисунке небольшой рамкой с подписью «адрес собеседника» (структура адреса сокета Интернета). Далее вызывается функция fork
и создается дочерний процесс функции inetd
. Поскольку дочерний процесс запускается с копией содержимого памяти родительского процесса, структура адреса сокета доступна дочернему процессу, как и дескриптор присоединенного сокета (так как дескрипторы совместно используются родительским и дочерним процессами). Но когда дочерний процесс с помощью функции exec
запускает выполнение реального сервера (скажем, сервера Telnet), содержимое памяти дочернего процесса заменяется новым программным файлом для сервера Telnet (то есть структура адреса сокета, содержащая адрес собеседника, теряется). Однако во время выполнения функции exec
дескриптор присоединенного сокета остается открытым. Один из первых вызовов функции, который выполняет сервер Telnet, – это вызов функции getpeername
для получения IP-адреса и номера порта клиента.
Рис. 4.9. Порождение сервера демоном inetd
Очевидно, что в приведенном примере сервер Telnet при запуске должен знать значение функции connfd
. Этого можно достичь двумя способами. Во-первых, процесс, вызывающий функцию exec
, может отформатировать номер дескриптора как символьную строку и передать ее в виде аргумента командной строки программе, выполняемой с помощью функции exec
. Во-вторых, можно заключить соглашение относительно определенных дескрипторов: некоторый дескриптор всегда присваивается присоединенному сокету перед вызовом функции exec
. Последний случай соответствует действию функции inetd
– она всегда присваивает дескрипторы 0, 1 и 2 присоединенным сокетам.
Функция sockfd_to_family
, представленная в листинге 4.4, возвращает семейство адресов сокета.
Листинг 4.4. Возвращаемое семейство адресов сокета
//lib/sockfd_to_family.c
1 #include "unp.h"
2 int
3 sockfd_to_family(int sockfd)
4 {
5 union {
6 struct sockaddr sa;
7 char data[MAXSOCKADDR];
8 } un;
9 socklen_t len;
10 len = MAXSOCKADDR;
11 if (getsockname(sockfd, (SA*)un.data, &len) < 0)
12 return (-1);
13 return (un.sa.sa_family);
14 }
Выделение пространства для наибольшей структуры адреса сокета
5-8
Поскольку мы не знаем, какой тип структуры адреса сокета нужно будет разместить в памяти, мы используем в нашем заголовочном файле unp.h
константу MAXSOCKADDR
, которая представляет собой размер наибольшей структуры адреса сокета в байтах. Мы определяем массив типа char
соответствующего размера в объединении, включающем универсальную структуру адреса сокета.
Вызов функции getsockname
10-13
Мы вызываем функцию getsockname
и возвращаем семейство адресов.
Поскольку POSIX позволяет вызывать функцию getsockname
на неприсоединенном сокете, эта функция должна работать для любого дескриптора открытого сокета.
Все клиенты и серверы начинают работу с вызова функции socket
, возвращающей дескриптор сокета. Затем клиенты вызывают функцию connect
, в то время как серверы вызывают функции bind
, listen
и accept
. Сокеты обычно закрываются с помощью стандартной функции close
, хотя в разделе 6.6 вы увидите другой способ закрытия, реализуемый с помощью функции shutdown
. Мы также проверим влияние параметра сокета SO_LINGER
(см. раздел 7.5).
Большинство серверов TCP являются параллельными. При этом для каждого клиентского соединения, которым управляет сервер, вызывается функция fork
. Вы увидите, что большинство серверов UDP являются последовательными. Хотя обе эти модели успешно использовались на протяжении ряда лет, имеются и другие возможности создания серверов с использованием программных потоков и процессов, которые мы рассмотрим в главе 30.
1. В разделе 4.4 мы утверждали, что константы INADDR_
, определенные в заголовочном файле
, расположены в порядке байтов узла. Каким образом мы можем это определить?
2. Измените листинг 1.1 так, чтобы вызвать функцию getsockname
после успешного завершения функции connect
. Выведите локальный IP-адрес и локальный порт, присвоенный сокету TCP, используя функцию sock_ntop
. В каком диапазоне (см. рис. 2.10) будут находиться динамически назначаемые порты вашей системы?
3. Предположим, что на параллельном сервере после вызова функции fork
запускается дочерний процесс, который завершает обслуживание клиента перед тем, как результат выполнения функции fork
возвращается родительскому процессу. Что происходит при этих двух вызовах функции close
в листинге 4.3?
4. В листинге 4.2 сначала измените порт сервера с 13 на 9999 (так, чтобы для запуска программы вам не потребовались права привилегированного пользователя). Удалите вызов функции listen
. Что происходит?
5. Продолжайте предыдущее упражнение. Удалите вызов функции bind
, но оставьте вызов функции listen
. Что происходит?
Глава 5
Пример TCP-соединения клиент-сервер
5.1. ВведениеНапишем простой пример пары клиент-сервер, используя элементарные функции из предыдущей главы. Наш простой пример – это эхо-сервер, функционирующий следующим образом:
1. Клиент считывает строку текста из стандартного потока ввода и отправляет ее серверу.
2. Сервер считывает строку из сети и отсылает эту строку обратно клиенту.
3. Клиент считывает отраженную строку и помещает ее в свой стандартный поток вывода.
На рис. 5.1 изображена пара клиент-сервер вместе с функциями, используемыми для ввода и вывода.
Рис. 5.1. Простой эхо-клиент и эхо-сервер
Между клиентом и сервером мы показали две стрелки, но на самом деле это одно двустороннее соединение TCP. Функции fgets
и fputs
имеются в стандартной библиотеке ввода-вывода, а функции writen
и readline
приведены в разделе 3.9.
Мы разрабатываем нашу собственную реализацию эхо-сервера, однако большинство реализаций TCP/IP предоставляют готовый эхо-сервер, работающий как с TCP, так и с UDP (см. раздел 2.12). С нашим собственным клиентом мы также будем использовать и готовый сервер.
Соединение клиент-сервер, отражающее вводимые строки, является корректным и в то же время простым примером сетевого приложения. На этом примере можно проиллюстрировать все основные действия, необходимые для реализации соединения клиент-сервер. Все, что вам нужно сделать, чтобы применить его к вашему приложению, – это изменить операции, которые выполняет сервер с принимаемыми от клиентов данными.
С помощью этого примера мы можем не только проанализировать запуск нашего клиента и сервера в нормальном режиме (ввести строку и посмотреть, как она отражается), но и исследовать множество «граничных условий»: выяснить, что происходит в момент запуска клиента и сервера; что происходит, когда клиент нормальным образом завершает работу; что происходит с клиентом, если процесс сервера завершается до завершения клиента или если возникает сбой на узле сервера, и т.д. Рассмотрев эти сценарии мы сможем понять, что происходит на уровне сети и как это представляется для API сокетов, и научиться писать приложения так, чтобы они умели обрабатывать подобные ситуации.
Во всех рассматриваемых далее примерах присутствуют зависящие от протоколов жестко заданные (hard coded) константы, такие как адреса и порты. Это обусловлено двумя причинами. Во-первых, нам необходимо точно понимать, что нужно хранить в структурах адресов, относящихся к конкретным протоколам. Во-вторых, мы еще не рассмотрели библиотечные функции, которые сделали бы наши программы более переносимыми. Эти функции рассматриваются в главе 11.
В последующих главах код клиента и сервера будет претерпевать многочисленные изменения, по мере того как вы будете больше узнавать о сетевом программировании (см. табл. 1.3 и 1.4).
5.2. Эхо-сервер TCP: функция mainНаши клиент и сервер TCP используют функции, показанные на рис. 4.1. Программа параллельного сервера представлена в листинге 5.1 [1]1
Все исходные коды программ, опубликованные в этой книге, вы можете найти по адресу http://www.piter.com.
[Закрыть].
Листинг 5.1. Эхо-сервер TCP (улучшенный в листинге 5.9)
//tcpcliserv/tcpserv01.с
1 #include "unp.h"
2 int
3 main(int argc, char **argv)
4 {
5 int listenfd, connfd;
6 pid_t childpid;
7 socklen_t clilen;
8 struct sockaddr_in cliaddr, servaddr;
9 listenfd = Socket(AF_INET, SOCK_STREAM, 0);
10 bzero(&servaddr, sizeof(servaddr));
11 servaddr.sin_family = AF_INET;
12 servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
13 servaddr.sin_port = htons(SERV_PORT);
14 Bind(listenfd, (SA*)&servaddr, sizeof(servaddr));
15 Listen(listenfd, LISTENQ);
16 for (;;) {
17 clilen = sizeof(cliaddr);
18 connfd = Accept(listenfd, (SA*)&cliadd, &clilen);
19 if ((childpid = Fork()) == 0) { /* дочерний процесс */
20 Close(listenfd); /* закрываем прослушиваемый сокет */
21 str_echo(connfd); /* обрабатываем запрос */
22 exit(0);
23 }
24 Close(connfd); /* родительский процесс закрывает
присоединенный сокет */
25 }
26 }
Создание сокета, связывание с известным портом сервера
9-15
Создается сокет TCP. В структуру адреса сокета Интернета записывается универсальный адрес ( INADDR_ANY
) и номер заранее известного порта сервера ( SERV_PORT
, который определен как 9877 в нашем заголовочном файле unp.h
). В результате связывания с универсальным адресом системе сообщается, что мы примем соединение, предназначенное для любого локального интерфейса в том случае, если система имеет несколько сетевых интерфейсов. Наш выбор номера порта TCP основан на рис. 2.10. Он должен быть больше 1023 (нам не нужен зарезервированный порт), больше 5000 (чтобы не допустить конфликта с динамически назначаемыми портами, которые выделяются многими реализациями, происходящими от Беркли), меньше 49 152 (чтобы избежать конфликта с «правильным» диапазоном динамически назначаемых портов) и не должен конфликтовать ни с одним зарегистрированным портом. Сокет преобразуется в прослушиваемый при помощи функции listen
.
Ожидание завершения клиентского соединения
17-18
Сервер блокируется в вызове функции accept
, ожидая подключения клиента.
Параллельный сервер
19-24
Для каждого клиента функция fork
порождает дочерний процесс, и дочерний процесс обслуживает запрос этого клиента. Как мы говорили в разделе 4.8, дочерний процесс закрывает прослушиваемый сокет, а родительский процесс закрывает присоединенный сокет. Затем дочерний процесс вызывает функцию str_echo
(см. листинг 5.2) для обработки запроса клиента.
Функция str_echo
, показанная в листинге 5.2, выполняет серверную обработку запроса клиента: считывание строк от клиента и отражение их обратно клиенту.
Листинг 5.2. Функция str_echo: отраженные строки на сокете
//lib/str_echo.c
1 #include "unp.h"
2 void
3 str_echo(int sockfd)
4 {
5 ssize_t n;
6 char buf[MAXLINE];
7 for (;;) {
8 if ((n = read(sockfd, buf, MAXLINE)) > 0)
9 return; /* соединение закрыто с другого конца */
10 Writen(sockfd, line, n);
11 }
12 }
Чтение строки и ее отражение
7-11
Функция read
считывает очередную строку из сокета, после чего строка отражается обратно клиенту с помощью функции writen
. Если клиент закрывает соединение (нормальный сценарий), то при получении клиентского сегмента FIN функция дочернего процесса read
возвращает нуль. После этого происходит возврат из функции str_echo
и далее завершается дочерний процесс, приведенный в листинге 5.1.