2006-06-30
_ [研究] WWW2006 reading
都内某所で謎の会議の後、大学に戻ってWWW2006のreading meeting。今日は初回で、Lさんが2本の論文を紹介してくれた。
Automatic Identification of User Interest For Personalized Search
ユーザの検索ログから嗜好を推測する話。Topic-sensitive PageRankをベースにしていて、user preference vectorをログから学習するらしい。
Beyond PageRank: Machine Learning for Static Ranking
本文、アンカーテキスト、PageRankなどいろいろなfeatureの組み合わせをニューラルネットワークで学習して、結局何が一番効くのか調べた。本文から作ったfeatureが一番精度に効くらしい。PageRankは比較的効かないとのこと。Microsoftの論文なのだがMSNのログと人海戦術で作った学習・評価用セットが結構大きく、まあよくやったなあという感じの論文であった。
READMEと日記の書き方