echo サーバを作ってみよう (3)

TOP >> ネットワークプログラミングの基礎知識 >> echo サーバを作ってみよう (3)

問題点

さて、ちゃんと動いているかのように見える echo サーバですが、問題点があります。サーバを実行して、telnet を2つ使って同時にサーバにアクセスしてください。先に接続したものは普通にデータのやりとりができますが、もう1つの telnet の方は文字列をタイプしても何も反応がありません。先に接続した telnet を終了させると、後の方の処理が始まります。

まぁこれは問題点というか、仕様であると言ってしまえばそれでおしまいなのかもしれません。でもやはり同時に複数のクライアントの相手をできる方が賢いでしょう。今回はこの点を改善してみます。

同時に複数のクライアントの相手をする

さて、具体的な方法ですが、ここでは複数のプロセスを使って、作業を分担させることにしましょう。

最初に実行されていたサーバ (親プロセス) はポートを見張り続けます。クライアントから接続があった場合は子プロセスを生成し、その後のクライアント相手は子プロセスにまかせることにします。親プロセスは子プロセスを生成した後は、クライアントとは関わりあわず、引続きポートを見張ることに専念します。

このように、同時に複数のクライアントが接続できるようなサーバを、マルチスレッドサーバといいます。

ここでいう「マルチスレッドサーバ」というのは、「同時に複数のクライアントが接続できる」という機能的な特徴を指しています。プロセスより小さな実行単位である「スレッド」という言葉がありますが、この「スレッド」を使っているから「マルチスレッドサーバ」と呼ぶわけではありません。ただし、「スレッド」を使って「マルチスレッドサーバ」を実現することもできます。

fork!

   37:     if ( $pid = fork() ){

さて、いきなりよくわからない方もいるかもしれません。 fork とは新しいプロセスを生成するシステムコールです。 UNIX では新しいプロセスを生成する方法は、システムコール fork(2) を使うしかありません。

念のため書いておきますが、exec(2) や system(3) は新しいプロセスを生成する関数ではありません。exec 系は「現在のプロセスに新しいプロセスを上書きする」ためのシステムコールです。元のプロセスはなくなってしまうので (新しいプロセスに上書きされてしまうから)、 OS全体としてのプロセス数は変わりません。また、system(3) は内部で fork/exec を呼び出しているライブラリ関数です。

なお、プロセスを作成する方法は fork(2) のみ、というのはほんとは嘘で、vfork(2)、rfork(2) というシステムコールもあります。

fork によるプロセスの生成は、(知らない人にとっては)とても特徴的です。 fork で作られる子プロセスは、親プロセス (fork を呼んだ側) のコピーなのです。ファイルハンドル、変数、環境変数など、子プロセスには親プロセスと全く同じ状態が引き継がれます。

唯一違うのが fork の戻り値です。サンプルを見てもらうと話は早いのですが、

if ( $pid = fork() ){
    ここに処理がくると親プロセス
} else {
    ここに処理がくると子プロセス
}

fork はプロセスの分身を作り出したあと、値を返します。ここで親プロセスには「新しく作ったプロセスのプロセス番号 (＝子プロセスのプロセス番号)」が返され、子プロセスには「0」が返されます。fork の戻り値を調べないと、自分自身が親プロセスなのか子プロセスなのかはわかりません。

もう少しわかりやすく書くと、

$pid = fork();
if ( $pid != 0 ){
    ここに処理がくると親プロセス
} else {
    ここに処理がくると子プロセス
}

というわけです。上に少し書いたとおり、ファイルハンドル、変数、環境変数などは全て同じものが渡されます。これは子プロセスのメモリ領域に、親プロセスのメモリ領域のデータをまるごとコピーしたということです。

ちなみに、ここで子プロセスが exec(2) を使って他のプログラムを実行すると、シェルのできあがりです。sh や csh、tcsh、bash などはこういう仕組みでコマンドを実行しているのです (もちろん他にもたくさんの処理をしていますが、基本の部分はコレです)。

とにかくこれで子プロセスが生成されました。まずは親プロセスから片付けましょう。

   37:     if ( $pid = fork() ){
   38:                 # こちらは親プロセス
   39:         print "親プロセス($$): 引続きポート $port を見張ります。\n";
   40:         print "親プロセス($$): クライアントの相手はプロセス $pid が行います。\n";
   41: 
   42:                 # 親プロセスはソケットをクローズ
   43:         close(CLIENT);
   44:         next;
   45:     } else {

とっても短いですね。まずメッセージを出力した後、ソケット CLIENT を close します。クライアントとのやりとりは子プロセスにまかせるのですから、もうクライアントとの出入口であるソケットは必要ありません。親プロセスの担当は CLIENT_WAITING の方です。

なお、親プロセスと子プロセスは同じソケット CLIENT を持っていますが、親子が同時に CLIENT に向けて出力しようとすると、クライアントには両方のデータが届くようです。また、クライアントからのデータは親プロセスに渡るか子プロセスに渡るかは、そのとき次第のようです。ただし、こういったちょっと illegal なことは OS によって挙動が違う可能性がありますので、親プロセスと子プロセスが同時に同じソケットに対してデータのやりとりを行うことはお勧めできません。親か子のどちらかがソケットを close して、クライアントとのやりとりは他方にまかせましょう。

そして次の next によって、処理は

   27:     $paddr = accept(CLIENT, CLIENT_WAITING);

に移ります。親プロセスは子プロセスを生成したら、引続きポートを監視し続けます。別のクライアントが接続してこないと、ここで動作は止まります (ブロックしている)。新たなクライアントがやってくると accept から戻り、再度 fork します。

次に子プロセス側です。

   45:     } else {
   46:                 # こっちは子プロセス
   47: 
   48:                 # クライアントに対してバッファリングしない
   49:         select(CLIENT); $|=1; select(STDOUT);
   50:         while (<CLIENT>){
   51:             print "子プロセス($$): メッセージ $_";
   52:                 # クライアントにメッセージを返す
   53:             print CLIENT $_;
   54:         }
   55:         close(CLIENT);
   56:         print "子プロセス($$): 接続が切れました。終了します。\n";
   57:                 # ポートの監視は親プロセスが行っているので、
   58:                 # クライアントとのやりとりが終了すれば exit
   59:         exit;
   60:     }

やっていることは、ほとんど前バージョンと違いはありませんが、大事なのは最後の

   59:         exit;

です。ポートを見張る仕事は親プロセスが行うのですから、子プロセスはクライアントとのやりとりが終了すれば exit で自分自身のプロセスを終了させます。もし exit がないと、クライアントからの接続が終っても、意味のないプロセスが残ってしまいます。

この改良版を動かして、同時に複数の telnetで接続してみてください。どの telnet でも、タイプした文字が即座に返ってくるはずです。

listen と accept

最初の echo サーバの説明では、listen と accept については軽く触れただけでした。ここで詳しい説明をしておきましょう。

   20: listen(CLIENT_WAITING, SOMAXCONN)
   21:      or die "listen: $!";

   27:     $paddr = accept(CLIENT, CLIENT_WAITING);

listen というのは、OS に対して「ポートに接続してきたクライアントとのコネクションを確立しておいてね」と命令しているのです。

ここで思い出して欲しいのですが、非マルチスレッド版 echo サーバ (最初に作った echo サーバ)に対して複数の telnet で接続すると、後から接続した方は、前のクライアントが終了するまで待たされはしたものの、ちゃんとデータのやりとりはできていましたよね? 「今このクライアントの相手をしているから、あなたはダメ」なんて言われて接続拒否、なんてことはありませんでした。

これは、クライアントが待たされていたときには、既にコネクションは確立されていたからです。OS は一つのポートに同時に複数の接続要求があると、片っ端からコネクションを確立していきます。そして先に来たクライアントから順に、待ち行列に登録していきます。

ちなみに、その待ち行列の長さを指示しているのが、listen の第二引数である SOMAXCONN です。これを上回る数のクライアントが接続してきた場合は、 OS はそのクライアントは無視します。

しかし listen した時点では、サーバプロセスからはクライアントがやってきたことを知ることはできません。コネクションの確立は、あくまでもOSが陰でやっていることなのです。

一方、accept というのは、待ち行列の先頭のクライアントと繋がった出入口(＝ソケット)を新しく生成し、そのクライアントを待ち行列から外すシステムコールです。 accept した時点で、初めてサーバプロセスはクライアントが待っていたことを知ることができます。

イメージしにくい方のために、受け付け嬢の例え話をしましょう。

お客さん … クライアント
受け付け嬢 … OS
担当社員 … サーバ

とします。

お客さんが担当の社員に会いに、会社にやってきます (connect)。

お客さんはまず受け付け嬢のところに向かいます。受け付け嬢はお客さんを来客者名簿に登録し、「担当の者が参りますので、しばらくお待ち下さい」と言うのです。これが listen です。

担当社員が accept すると、お客さんとの話が始まります。その間に新たなお客さんがやってくると、受け付け嬢のところで待たされます。担当社員とお客さんの話が終わり、再び accept するまでお客さんは受け付け嬢のところで待たなければいけません。

つまり、最初の echo サーバは、担当社員が1人しかいなかったので、同時に複数のお客さんを相手にすることができなかったのです。しかし、マルチスレッド版 echo サーバでは、担当社員が複数存在します。複数の社員が accept することで、受け付け嬢のところでお客さんが待たなくてもよい、というわけです。

backlog

   20: listen(CLIENT_WAITING, SOMAXCONN)

の SOMAXCONN について説明しましょう。ここに指定する値は backlog といって、まだ accept されていないコネクション (OS が待たせているコネクション) の最大数を指定するものです。もし backlog 以上のクライアントが同時に connect してきた場合は、何もレスポンスを返しません。

先の受け付け嬢の例え話を出すと、お客さんがやってくると受け付け嬢はお客さんを来客者名簿に登録し、「担当の者が参りますので、しばらくお待ち下さい」と対応します。しかし、担当者を待っているお客さんが backlog の数を越えてしまうと処理しきれなくなるので、お客さんを無視します (レスポンスを返さない)。

直接数字を指定してもいいですし、このように SOMAXCONN を指定すると、 OS が許す最大値を意味します。FreeBSD 2.2.7-RELEASE では /usr/include/sys/socket.h で

#define   SOMAXCONN   128

と定義されているので、

listen(CLIENT_WAITING, SOMAXCONN)

と

listen(CLIENT_WAITING, 128)

は同じ意味です。

ただし、注意しなければいけないのは、ここで指定した値がそのまま使われないかもしれない、ということです。backlog の解釈は OS によって異なり、

BSD 系 OS では、backlog に 1.5 を乗じた値が使われる
Solaris 2.6 や HP-UX では、適当な係数を乗じた値が使われる
Linux では backlog に指定した値がそのまま使われる
Solaris2.5.1 では +1 した値が使われる

などと解釈されます。特に理由がなければ SOMAXCONN を指定しておくといいでしょう。

なお、このスクリプトの中で SOMAXCONN という定数を設定しているのは、 Socket モジュールです。

ちなみに、FreeBSD 2.2.7-RELEASE では、listen すると以下のカーネルソース部分に処理が渡ります。

@kern/uipc_syscalls.c (/usr/src/sys/kern/uipc_syscalls.c)
int listen(p, uap, retval){
    ....
    return (solisten((struct socket *)fp->f_data, uap->backlog));
}

ここでは下請け関数 solisten の2番目の引数に backlog をそのまま渡しています。

@kern/uipc_socket.c
int solisten(so, backlog){
    ...
    if (backlog < 0 || backlog > somaxconn)
            backlog = somaxconn;
    so->so_qlimit = backlog;
    ....
}

solisten では backlog の値をチェックして待ち行列の最大数を表す so_qlimit に代入します。 @kern/uipc_socket2.c struct socket *sonewconn1(head, connstatus){ if (head->so_qlen > 3 * head->so_qlimit / 2) return ((struct socket *)0); クライアントから接続されたときは、まだ accept されていないコネクション数 so_qlen が so_qlimit の 1.5倍 (3分の2) より多ければ何もせず return します。 SOMAXCONN は 128 なので、まだ accept していないコネクションは 192 個 (=128*1.5) 待たせておけるわけです。なお、accept 済のコネクションはこの中に含まれません。ああ、オープンソースって素晴らしい。

前へ << echo サーバを作ってみよう (2) echo サーバを作ってみよう (4) >> 次へ TOP >> ネットワークプログラミングの基礎知識 >> echo サーバを作ってみよう (3) ご意見・ご指摘は Twitter: @68user までお願いします。

echo サーバを作ってみよう (3)

問題点

同時に複数のクライアントの相手をする

改良版 echo サーバ

fork!

listen と accept

backlog