トップ «前の日記(2007-04-18) 最新 次の日記(2007-04-24)» 編集

豊田正史のSLとは関係ございません


2007-04-20

_ [研究] 第2回 ウェブリンク解析の会

脇田さん、宇野さん、近藤さんらとなんとなくはじめた会ですが、今回NTTの風間さん、NICT/ATRの湯田様、藤原様、東工大村田先生、に御参加いただき20名弱での開催となりました。2回目にして意外な大所帯になってしまいました。

湯田様からは、mixiのネットワーク解析と最近の話を少々していただきました。mixiの知り合いネットワークの直径は6程度であり、スモールワールドっぽい。ネットワークをNewmanらの手法でクラスタリングすると、サイズ対クラスタ数の累積割合においてサイズ百から数百の間にほとんどクラスタの存在しない領域(スキップ、ギャップ)がある。この傾向は、高い次数のノードを削除しても変わらない。ネットワーク成長モデルに一定のランダム性を導入すると、べき分布からかなりスキップのある分布の間をカバーでき、その中間あたりにmixiの分布があることが分かる。最初は親密な知り合いの紹介で参入するが、しばらくするとちょっと遠い友人を見つけ、その友人のクラスタと結合するというプロセスで説明できるのではないか。Newmanらのクラスタリングは中程度のクラスタのマージの際に不安定な挙動を示すことがあり、その解析も行っている。

風間さんからは、Ingrid, ODIN, Webからの人間関係抽出など、これまでの仕事のダイジェストをしていただいた後、ブログのトラックバックネットワークの話をしていただきました。入出次数、ページランク、HITS、中心性などさまざまなスコアを計算し、スコアがネットワーク上にどのように分布しているか調査。次数、HITS、中心性はネットワーク中心の密な部分に高いスコアが集中するが、ページランクは広い範囲に高いスコアが散逸する。

村田先生からは、Yahoo!知恵袋における人間関係予測の話をしていただきました。過去の人間関係の推移から、未来の人間関係を予測できるかという話。2〜3割程度あたるらしい。

湯田様、藤原様にせっかく遠いところを来て頂いたので、私もこれまでの仕事をリンク解析よりにまとめた話をさせてもらいました。

学生さんを置いてきぼりにして、議論を色々してしまったのが反省点かも。今後も続けていくことには、皆さんの賛同を得られたように思いますので2ヶ月に1回程度のペースでやっていきたいと思います。まあ自己紹介フェーズも大体終わったので今後はそれぞれの話をできるだけ深く話すような形にしたいなあと勝手に思っています。


README日記の書き方