UTF-8小話
ものだけど、最近古本屋で見つけた「インターネットヒストリー」の村井純先生のあとがきに気になる記述があった。
ちょっと長くなるけど引用する。
かなり昔の話だが、ベル研のUNIXを作ったオペレーティングシステムを担当していたグループにオペレーティングシステムについての講演を頼まれたときに「日本語」の話をしたことがある。正直にいうと、ケン・トンプソンやデニスリッチなど、コンピュータ界のノーベル賞といわれるチューリング賞をとった錚々たるメンバーを前にして、当時「ただの研究者」であった自分がオペレーティングシステムについて何を話したらよいのだろうと悩んでしまった。結局開き直って話すことにしたのが漢字の問題だったわけだ。しかし、このときの講演の内容が、彼らにとっては1バイト1文字という「彼らの常識(UNIX記述言語のC言語では、8bitの領域をcharと呼ぶひどさ!)」を覆すことになり、UNIXの国際化が進むことになった。私はその1年後にまた彼らに招かれたのだが、その時に気づいたのは、それ以降の半年間というもの、デニスリッチはビットマップに漢字を出す研究しかしていたかったということだ。好きなことをやらしてくれるベル研の環境にも感心したが、それだけ「マルチバイト文字」というのは彼らにとっても興味を持続するに値するほどのまったく新しい概念だったようだ。
なかなかすごいシチュエーションだけど、この出会いがなければUTF-8が生まれることもなかったのだろうか?
ちなみにISO-2022-JPを発案したのは村井先生。
(追記:2008-10-08)かなりブックマークされていてびっくり。Plan9がらみってことで無理矢理このエピソードを紹介したけど、「インターネットヒストリー」は良書なので、インターネットの歴史に興味ある人は一読をお勧めする。ちなみにちょっと前に出会った人がインタビューイとして出てきて、あのおじさんはそんなにすごい人だったんだと驚いた。
- 作者: ニールランダール,Neil Randall,村井純,村井佳世子,田中りゅう
- 出版社/メーカー: オライリー・ジャパン
- 発売日: 1999/06
- メディア: 単行本
- 購入: 3人 クリック: 45回
- この商品を含むブログ (6件) を見る