ktrans(SKK)の辞書

前回の続きで、ktransの辞書を強化してみよう。元となるSKKの辞書はSKK OpenLabのページから入手できる。基本辞書にはS、M、ML、Lという4種類があるが、1語/行として語数はこんな感じである。

$ wc SKK-JISYO.*|sort
3412 6973 55799 SKK-JISYO.S
8379 16912 144584 SKK-JISYO.M
48801 97776 953002 SKK-JISYO.ML
175765 357608 4489183 SKK-JISYO.L

とりあえずMLぐらいでよいんじゃないだろうか。

ktransから使うには少し準備が必要である。まず、tcsで文字コードUTF-8に変換し、sedする。(読みにくいが)二番目のコマンドは2つのスペースをタブに変換している。これでずいぶん快適になる。

% hget http://openlab.jp/skk/dic/SKK-JISYO.ML.gz | gunzip > SKK-JISHO.ML
% tcs -f ujis SKK-JISYO.L > SKK-JISHO.ML.utf8
% sed -e 's/\// /g' -e 's/ / /g' -e 's/ $//g' < SKK-JISHO.ML.utf8 > ktrans-jisho.ml
% cp ktrans-jisho.ml $home/lib/ktrans-jisho

あとはユーザ辞書が使えればなぁ。