2006-03-01
2006-03-02
_ [学会] DEWS2006 2日目
深夜までの査読がたたってきついきつい
- 3B-o2: リンク解析を用いたウェブ上のスパム発見手法に関する一考察. 小野拓史, 豊田正史, 喜連川優(東大)
- 面倒を見ていた修士学生さんの発表。極大クリーク列挙と、隣接ノード共有数を類似度としたクラスタリングでリンクファーム的なスパムを抽出できるかどうか調査してみたというような論文。質疑では、スパムとは何かというメタ議論になってしまったが、そもそもそれを考えるための材料を提供するという気持ちだったのだがなあ。
- 3B-o3: 多次元データマイニングを用いたWeb空間の構造解析. 山下 由展, 大森 匡, 星 守(電通大)
- 同じセッションでの大森先生の学生さんの発表。2部クリーク抽出でコミュニティを見つけておいて、コミュニティ単位のグラフでページランクを計算。リンク元リンク先のドメインを限定したりして色々な切り口でのランキングを可能にしている。是非大きいデータセットで試すと面白そう。
- 1B-i6: ブログ空間におけるトラックバック利用状況の調査および考察. 中島伸介(奈良先端大), 舘村純一(NEC Lab. America), 原 良憲(日本電気), 田中克己(京大, NICT), 植村俊亮(奈良先端大)
- トラックバックの99%は元記事への参照リンクなし。
- 3D-d4: マルチファセットブログ記事検索システム「BlogRanger」. 戸田浩之, 井上孝史, 廣嶋伸章, 杉崎正之, 栗島聡哉, 藤村考,片岡良治 (NTTサイバーソリューション研究所)
- BlogRangerのデモ。色々細かいことを聞かせていただいて参考になった。
懇親会ではお茶女の学生さんたちが大活躍。2次会、3次会とフル参加してたら朝の4時で部屋に帰るなりバタンキュー。
2006-03-03
_ [学会] DEWS2006 3日目
昨日の飲みがたたってきついきつい。
- 5C-oi1: 質問キーワードの順序依存性に基づくWebアーカイブ検索方式. 賀家 智代, 角谷 和俊(兵庫県立大)
- キーワードの出現パターンに応じて、アーカイブ検索のクエリ式を調整?する試み。なんか面白そう
- 4D-d2: WWWのリンク切れで困っていませんか?- The WISH Project -. 飯田 敏成, 澤 菜津美, 森嶋 厚行, 杉本 重雄, 北川 博之 (筑波大学)
- 切れたリンクの移動先を検索エンジンよりも先に見つけようという試み。日頃からの監視は必要。
- 7A-o5: 距離と属性を考慮したPrefixSpanによる感情表現抽出. 佐藤一誠, 平手勇宇, 山名早人(早大)
- 文書を単語列とみなし、シーケンスマイニングで頻出表現を抽出する。アマゾンの書評を引きずり出してきて、表現抽出実験を行った。語順の違う同一表現は沢山あると思うのだが、大丈夫なのだろうか。
帰りは市内に寄って、森嶋さん、田嶋さんと国際通りを少し歩く。飛行機の早い田嶋さんと別れたあと、ちょっと脇道にそれてみたら「大東そば」というお店を発見。なんかピンと来たので寄って食べてみると、もちもちとした麺とよいダシの出たスープで大正解。今までに食べた沖縄そばのなかでは一番うまいかも。ゆいレールで空港に出て帰宅。そういえば今回は飛行機での着陸の前になぜか顔面左側の神経がビリビリと痛んで難儀した。以前治療した歯の辺りからつながっているようだが、飛行機旅行のたびにこれだと困るなあ。というわけで、色々といつになくしんどい会議であった。
2006-03-08
_ ふくち [おれにも効果を分けてください。今年はヤバい。]
_ とよだ [まだ効くかどうか分からんですよ。でも今年はそんなにひどくないと思うけどなあ。]
_ HF [HPみた。なんだか大人気らしいな。それにしても当の請福酒造は クレハでそんな研究を知らなかった模様。 http://..]
_ HF [う、特許電子図書館の当該特許のリンクを貼ったつもりだったがうまく表示されないな。失礼。]
_ HF [投稿してから気が付いたが「医薬品として臨床試験」云々は ナンセンスでしたね。あと、アルコール蒸気の粘膜への直接作用 ..]
_ とよだ [請福酒造自身は医薬品として売るつもりはないみたいね。どの成分が効くのかも分かってないみたいだし。しかし花粉症のとき酒..]
_ はりー [あ、私も買おうか悩んでますがまだ買っていません。 是非、臨床実験のレポートをお願いします。 ちなみに試す会みたいな企..]
_ とよだ [う、試す会ですか。大学まで持ってくるの面倒だなあ。でもサンプルは多いほうが良いしなあ。]
2006-03-09
2006-03-10
2006-03-11
_ はりー [ぬぉぉ、来たんですね。 焼酎じゃ花粉症に効かないのかなぁぁあと今夜も焼酎を飲んでみています(笑) そういえば、ホテル..]
_ とよだ [くだんのクレハの実験ではいろんな泡盛で実験してたようですが、これが一番効いたということみたいです。そういえばDEWS..]
_ よしき [two cats. どなたの結婚パーティーだったのですか?]
_ とよだ [よしきもよくご存知のY君です。ところでtwo catsてなに?]
_ ZACKY [このたび結婚したYです。ご出席いただきありがとうございました。 手品はすごかったです。 ちなみに two cats ..]
_ あずま [Palo Altoの南にある高級住宅街Los Gatosの名前の意味が分かったよ。披露パーティには自分は珍しく無精ひ..]
_ よしき [Y君といっても何人かいるような気がするが、Zacky君というY君なのね。Los Gatosは猫みたいに見える岩がある..]
_ とよだ [ああ、ドスガトスとはそういう意味なのか。勉強になりました。ZACKYくん、楽しんでいただけたようで何より。]
2006-03-13
2006-03-14
_ [花粉症] ファンシー4日目
起床時の症状は昨日と同じく、詰まり感弱めで鼻水多め。5,6回鼻をかむ。外出時は今日も果敢にノーマスク。でもちょっと負け気味で、鼻がむずむず。日中は鼻がむずむずするも鼻水は少なく1,2回鼻をかむ程度。帰宅時もノーマスク。微妙に本格化の兆しが見える。寝る前にファンシー水割り1杯。効いているのかどうかはこれからおいおい分かっていくであろう。
_ [SL] SLコマンドHaskell版
なんてのを作っている人を発見してしまいました。(HaSL: SL(1) in Haskell) HaSL...ハッスルと読むのかなあ。以前とさんが、ML版を作ったりしてましたが、うーん、マニアック。
2006-03-15
_ [花粉症] ファンシー5日目
起床時の症状は、ちょっと右鼻詰まり。4,5回鼻水をかむ。外出時はノーマスクを続行。日中はちょっと鼻ぐすぐすするも、1,2回鼻をかむ程度。帰宅時もノーマスク。寝る前にファンシー水割り1杯。
_ [業界] Winnyとsl(1)
似てるね。どっちも人を介して感染するあたりが。実害は比較にならないけど。まあ、こんな声明したところで無駄無駄無駄。 Winnyを使わないように - 政府と業界が連携して呼びかけ (MYCOM PC WEB)2006-03-17
2006-03-20
_ [Software] lucene-1.9.1でdeprecatedになったインタフェース
基本的には1.4.3とコンパチだが、deprecatedになったインタフェースが結構たくさんある。使う上でぶつかったものについてのみ、リストアップしてみる。
- IndexWriterのパラメータをメソッドで設定するようになった。
-
writer.maxFieldLength = 1000000; writer.minMergeDocs = 10000; writer.mergeFactor = 50;
と書いていたのを、1.9.1以降では以下のようにする。writer.setMaxFieldLength(1000000); writer.setMaxBufferedDocs(10000); writer.setMergeFactor(50);
- DateFieldはもう使わない
- DateToolsインタフェースが新たに追加され、時間と対応する文字列相互の変換は、こちらで行うことになった。DateFieldでは、必ずmsecまでエンコードしてしまっていたため、対応文字列が長めになっていたが、DateToolsではresolutionを指定できる。荒くすれば対応文字列を短くすることができ、インデックスのサイズを節約できる
- Fieldのコンストラクタ統合
- これまでは、元の文字列をストアするかしないか、トークナイズするかしないか、といったオプションの組み合わせごとにファクトリーメソッドがあったのだが、それらがコンストラクタとそのオプションに統一された。こちらを使うとだいぶソースが読みやすくなる。
- Query.parse()はインスタンスメソッドに変更
- Query.parse()はstaticメソッドだったが、インスタンスメソッドに変更になった。
2006-03-22
_ [花粉症] ファンシー12日目
起床時の鼻詰まりは弱く、鼻水1,2回程度。ノーマスクで通勤。雨が降ってきたので、日中は症状ほとんどなし。くしゃみ少々。寝る前にファンシー水割り1杯。3月も下旬というのに平和過ぎ。
_ [開発] Perl 5.8.2 -> 5.8.8 でメモリリーク解消?
ia64のRedHat Linux環境で、Perl-5.8.2 + XML::Feed-0.8 + HTML::Parser-3.45の組み合わせでフィードをパースしているとバリバリメモリリークしてあっというまにメモリが食い潰されてしまい困っていた。おそらく主原因はHTML::Parser。XML::Feedもちょっとずつリークしているようなのだけどそれほとひどくはなかった。で今日、思い立ってPerl-5.8.8に上げてみたらひどいメモリリークは解消した模様。まだちゃんと調べてないけど。Perlのメモリリークはほんとに良く分からん。自分で作ったループ参照くらいならなんとかなりそうだが、ライブラリとか本体がらみになるともう駄目。
2006-03-24
2006-03-27
READMEと日記の書き方
_ HF [鼻粘膜が敏感になっているからじゃまいか。 つか沖縄現地料理うまそーだな。]
_ とよだ [埃とかにも反応するようになってんのかな。]