Time machine〜Lifestreams

最近、ホームユースのパソコン向けのデータバックアップアプライアンスが注目されている。MSRでMyLifeBitsプロジェクトを立ち上げたGordon Bell曰く「人間が一生かかって紡ぎ出すデータ量は約3Tバイト」とのこと。3Tバイトなんて見積りが低すぎるんじゃないかと思うけど、とにかく大量のデータが蓄積されていくので、これをうまく組織化して、高速に検索したり、ビジュアライズしたいというニーズが出てくる。この手の研究は古くからやられていて、David Gelernter*1のMirror worldsやLiftstreams、暦本純一さんのTime-Machine Computingなどが有名だ。

ちょっと視点を家庭に戻すと、玄箱のような自作NASがやけに目立った時期もあったが、AppleのTime machine (Time Capsule)やMicrosoft Windows Home Serverの登場で、家庭でもちょっと不安なので、バックアップシステムを導入しようという動きが広がってくるかもしれない。Time machineも単なるバックアップに留まらず、きっとLifestreamsシステムのように進化していくんじゃないかなぁ、などと考えている。

Plan9のバックアップシステムには、高林哲さんのRubyで実装したpdumpfsで知ったという人の方が多いと思うが、dumpfsという仕組みが存在する。最近は、Pythonで実装したという日記も見つけた。そもそもPlan9では、ファイルをWORM (Write Once Read Many)メディアに保存し*2、ハードディスク上のファイルシステムはそのキャッシュ管理という位置付けだった。そして、dumpfsによって、任意の日付の完全なスナップショットがユーザに提供される。今のfsの実装を調べたことがないので、現状はちょっと違っているかもしれない。ちょっと調べてみるかなぁ。

*1:ここを見に来るような人には、並列プログラミング言語 Lindaで知られているか。

*2:初期の論文によると、300ギガバイトSONY製光ディスクジュークボックスを使っていたらしい。当時、一度書いたら消せない、追記しかできない、という性質を利用した履歴管理ファイルシステムがいくつも研究されていた。