2006-05-26
_ [WWW2006] 本会議3日目
今さら(6/29)どうかと思うが、完成させとかないと気持ち悪いので書く。参加したセッションは、Data Mining、Data Mining Classification、Improved Ranking。気になった発表は以下。
Improved Annotation of the Blogosphere via Autotagging and Hierarchical Clustering
Technoratiのタグの階層クラスタリングをやって見たという論文。同じタグの付いた記事は本当に似ているかとか、タグが記事の検索に有用かどうかとか、そんなことを調べている。あまりオチはない。
Beyond PageRank: Machine Learning for Static Ranking
Microsoft Researchからの論文。本文、アンカー、PageRankなど様々なfeatureの組み合わせをニューラルネットで学習。なぜか本文が一番精度に効くとのこと。MSNのログと人海戦術で作った大きな評価セットを用いていて、なかなか文句がつけにくい。
READMEと日記の書き方