timeで見るspawn/channel
time(1)はUNIXでもおなじみだが、引数に与えられたコマンドの実行時間を測定するのに使われる。
; time sh -c 'ps | grep Sh' 1 1 oraccha 0:00.0 release 74K Sh[$Sys] 81 1 oraccha 0:00.0 release 73K Sh[$Sys] 0l 0.011r 0.011t
今回はtime(1)を例にスレッドのspawnとチャネル(channel)によるスレッド間通信について書きたいと思う*1。InfernoはUNIX/Plan9とは異なり、複数スレッド(プロセス)が単一のアドレス空間を共有するOSなので、fork&execは存在しない。新しいコマンドを実行する場合は、モジュールをloadして、スレッドをspawnする手順になる。
LimboのチャネルはHoareのCSP (Communicating Sequential Process)に大きな影響を受けたスレッド間通信手段である。スレッドはチャネルを介してメッセージを同期的に送受信する。使われる構文は、以前書いたNewSqueakとほとんど同じで(「Newsqueak (2): チャネル」)、チャネルが演算子"<-"の左辺値ならば受信、右辺値ならば送信である。
implement Time; include "sys.m"; include "draw.m"; include "sh.m"; FD: import Sys; Context: import Draw; Time: module { init: fn(ctxt: ref Context, argv: list of string); }; sys: Sys; stderr, waitfd: ref FD; init(ctxt: ref Context, argv: list of string) { sys = load Sys Sys->PATH; stderr = sys->fildes(2); waitfd = sys->open("#p/"+string sys->pctl(0, nil)+"/wait", sys->OREAD); if(waitfd == nil){ sys->fprint(stderr, "time: open wait: %r\n"); return; }
sys->pctlの戻り値は自分のスレッドIDである。"#p/n/wait"は"/prog/n/wait"にmountされているが*2、子スレッドの終了を待ったり、エラーを知るために使われるread onlyのファイルである。後のwaitfor関数で使う。
argv = tl argv; if(argv == nil) { sys->fprint(stderr, "usage: time cmd ...\n"); return; } file := hd argv; if(len file<4 || file[len file-4:]!=".dis") file += ".dis";
引数からロードするファイル名(*.dis)を生成している。「len 文字列」は文字列の長さを返す。文字列、配列はスライス([m:n])が使える。
t0 := sys->millisec(); c := load Command file; if(c == nil) { err := sys->sprint("%r"); if(1){ c = load Command "/dis/"+file; if(c == nil) err = sys->sprint("%r"); } if(c == nil) { sys->fprint(stderr, "time: %s: %s\n", hd argv, err); return; } }
「load Command ファイル名」でコマンドをloadする。CommandはShモジュールで定義されている。sprint関数で使われる"%r"はエラーメッセージに展開される。
t1 := sys->millisec(); pidc := chan of int; spawn cmd(ctxt, c, pidc, argv); waitfor(<-pidc);
ここからが肝心な箇所。まず、チャネル(pidc)を作り、cmdをspawnしている。spawnはPOSIXスレッドのpthread_createのイメージ。チャネルは何のために使われるかというと、子スレッド(cmd)の終了を待ち合わせるためである。"<-pidc"と書くことで、親スレッドの実行は(子スレッドから)チャネルに書き込みがあるまでブロックされる。
t2 := sys->millisec(); f1 := real (t1 - t0) /1000.; f2 := real (t2 - t1) /1000.; sys->fprint(stderr, "%.4gl %.4gr %.4gt\n", f1, f2, f1+f2); } cmd(ctxt: ref Context, c: Command, pidc: chan of int, argv: list of string) { pidc <-= sys->pctl(0, nil); c->init(ctxt, argv); }
cmd関数の一行目でチャネルに子スレッドIDを送信している。これで親スレッドはwaitfor関数の実行を開始する。init関数は前回のcatで説明した通りで、ここからtimeの引数で与えられたコマンドの実行が始まる。
waitfor(pid: int) { buf := array[sys->WAITLEN] of byte; status := ""; for(;;){ n := sys->read(waitfd, buf, len buf); if(n < 0) { sys->fprint(stderr, "sh: read wait: %r\n"); return; } status = string buf[0:n]; if(status[len status-1] != ':') sys->fprint(stderr, "%s\n", status); who := int status; if(who != 0) { if(who == pid) return; } } }
read(waitfd)はUNIX/Plan9のwaitpidだと思えばよい。子スレッドが終了するとスレッドIDとエラーメッセージがreadできる。プロセスに対する/progインタフェースの利用はより徹底されているようだ。
あと、"n := read(fd, buf, len buf); s = string buf[0:n];" というのはイディオム。
まとめ。
- チャネルによってスレッドの待ち合わせが簡単に書ける。
- スレッド(プロセス)のファイルインタフェースの利用はPlan9より徹底している。
*1:InfernoではLimboスレッド、Infernoカーネルプロセスという用語が使われるが、ユーザから見える(spawnで生成する)のは前者のLimboスレッドで、通常は単にスレッドと呼ばれる。JavaのグリーンスレッドやErlangのプロセスに近い。スレッドスケジューリング方式はラウンドロビンでDis内部のスケジューラが行う。一方、カーネルプロセスはホストOSやネイティブOSが提供するスレッドのことで、disは複数のカーネルプロセスによって実行される。emuでの実装はPOSIXスレッドである。LimboスレッドとInfernoカーネルプロセスはm:nマッピングで、Limboスレッドが複数のカーネルプロセスを渡り歩いて実行されることもある。というようにIPWLには書かれているが、manを読むとLimboプロセス、Limboスレッドが混ざって記載されているなぁ。
*2:/porgは/procのInferno版。