2007-03-29
_ [呟き] PASMO記念日
パスネット ようやく使い 切れたから 今日が私の PASMO記念日
うーん古い。しかも記念日はホントは昨日だし。ググッてみたら「PASMO記念日」は11件。微妙。歌までパクッた人はいないようだが、思いついても書かないだけだろうな。
_ [開発] lucene-2.1.0への移行準備
そろそろ移行を考えなくてはいけないようになってきた。とりあえずやった作業をリストアップ。
- sen-1.2.2.1: conf/sen.xml,sen-processor.xmlのcharsetをutf-8に修正。dictionary.propertiesのsen.charsetをutf-8に変更。
- ipadic-2.6.0: 2.6.3はsen用にコンパイルしようとするとエラーを吐くので2.6.0のまま。Nounにいくつかエントリーを追加(なぜシャンプーはあるのにリンスはないのか)。辞書コンパイルのときmaxmemory=140mでは足りなかったので512mへ変更。
- lucene-ja-2.0test2: ストップワードを全削除。やっぱりないと困る時があるため。クエリの方をフィルタする方向で。analysis/ja/analyzer-*.xmlのstop内にあるwordを全部消した。lettersはそのまま。そういえば、結構謎のストップワードが登録されているのに今頃気が付いた。「人物」はなぜストップワードなのか?
- lucene-2.1.0は特に変更の必要なし。1.9.1への移行のときAPIは新しいものを使うようにしていたので、インデクサはそのままコンパイルできた。とりあえずテスト用の小さいインデックスは問題なく動いている模様。
READMEと日記の書き方