2004-05-17
_ [学会] WWW2004に参加のためNYへ
WWW2004に参加するためニューヨークへ移動。 国際線では始めてANAを利用した。 機内で、今回飛行機旅行のために用意した秘密兵器、SENNHEISERの ノイズガードヘッドホンを試す。そんなに静かになる訳ではないが快適。素晴らしい。 機内食は、ウナ丼のようなもの、カップヌードル、オムレツの3回。 UAよりもましな方かな。 映画「ペイチェック」の後半だけ観て後はほとんど寝て過ごす。 先週ひいた風邪がまだ後を引いており、降下中耳が抜けなくてひどく痛んだ。 飛行機を降りても耳は圧迫されたまま。辛い。
ホテルへは、Air Trainと地下鉄E線を使って移動。 Air Trainの駅で、北大の藤間さん、Aran Lunzerさんと一緒になる。 ホテルは、7th Ave.駅のすぐ近くにあり、12時頃チェックイン。 40階の高層階の部屋をあてがわれたが、目の前にもでかいビルがあり眺めは最悪。 明日のワークショップのプレゼンがまだできていなかったので、 午後は部屋にこもってプレゼン作り。 途中で下に降りてWWWのレジストレーションを済ます。 プロシーディングスが相変わらず重い。 今回のバッグはリュックサックで帰国後も使えそうだ。
午後7時ごろ波多野さん到着、吉川先生と合流して夕飯を食べに行こうとしたら部屋のトイレが詰まりやがった。フロントに電話して直してもらう。 夕食は近くのデリでツナサンドイッチを食すも敗北。
2004-05-18
_ [学会] Int'l. Workshop on Web Dynamics
今日は朝からWeb Dynamicsというワークショップに参加。 googleのランキングを定期的に調べたり、チリのWeb構造の変化を調べたりして いる人達がいた。総じて低調。あまりdynamicsでない発表もあったし。
昼食の時に、東工大奥村先生御一行様、NII武田さんなどに会う。 Weblogging Ecosystemというworkshopに参加されている人達だ。 結構盛り上がっているらしい。 最近ほんとに流行りだが、はたしていつまで続くものやら。 早くも研究的にはネタが無くなりつつあるような気もする。
NEC舘村さんにも遭遇。 NECからはWeb検索系の人達が出ていってしまったそうで、Wen Shan Leeも どこかにいってしまい舘村さんはWen Shanの引き継ぎをやっているそうだ。
午後ワークショップで、ウェブの構造変化ブラウザの発表を行った。 実装は何でやっているか、変化のメトリックスを導入するのはどうか、 グラフが大きくなったらどうするのかなどの質問が出た。 MITのBenjamin Kooという人がえらく気に入ってくれたらしく、色々と話して名刺交換。 発表後に、IBMの人だったかに、ソフトの配布はしているか聞かれた。 まだ配布していないが、ソースはあげられるよと答えたら、 後でメールすると言ってたけどまだ来てないな。
夕飯は、波多野さん吉川さんとともにセントラルパーク近くの中華料理屋。 春巻、海老とライチの炒め物、酢豚、チャーハンを食す。勝利。
2004-05-19
_ [学会] WWW2004初日
今日から本会議。キーノートスピーチはTim Berners-Lee。 あいかわらずセマンティックウェブの話。 講演資料はウェブに置いてある。
午前のセッションは Learning Classifiers。
LiveClassifier: Creating Hierarchical Text Classifiers through Web Corpora
- Chien-Chung Huang, Academia Sinica
- Shui-Lung Chuang, Academia Sinica
- Lee-Feng Chien, Academia Sinica & National Taiwan University
Using URLs and Table Layout for Web Classification Tasks
- Lawrence Kai Shih, MIT
- David R. Karger, MIT
Learning Block Importance Models for Web Pages
- Ruihua Song, Microsoft Research
- Haifeng Liu, University of Toronto
- Ji-Rong Wen, Microsoft Research
- Wei-Ying Ma, Microsoft Research
午後一のセッションは Information Extraction。
Unsupervised Learning of Soft Patterns for Generating Definitions from Online News
- Hang Cui, National University of Singapore
- Min-Yen Kan, National University of Singapore
- Tat-Seng Chua, National University of Singapore
用語の定義をパターンマッチで抽出する手法。パターンといっても 普通のパターンマッチでなく、確率的なマッチングみたいなものが入った ファジー?なもの。
Web-scale Information Extraction in KnowItAll (Preliminary Results)
- Oren Etzioni, University of Washington
- Michael Cafarella, University of Washington
- Doug Downey, University of Washington
- Stanley Kok, University of Washington
- Ana-Maria Popescu, University of Washington
- Tal Shaked, University of Washington
- Stephen Soderland, University of Washington
- Daniel S. Weld, University of Washington
- Alexander Yates, University of Washington
ウェブ上にある製品の評価で肯定的な物は何%、否定的な物は何%あるか、 など、ウェブを全体的に見ないと答えられないような質問に答える ためのフレームワークを作ることが目標らしいが、この論文では まだかなりゴールまでの距離は長そうだなあ。
Is question answering an acquired skill?
- Ganesh Ramakrishnan, IIT Bombay
- Soumen Chakrabarti, IIT Bombay and CMU
- Deepa Paranjpe, IIT Bombay
- Pushpak Bhattacharyya, IIT Bombay
Soumen Chackrabartiの発表。いまいち良く分からん。
夕方のセッションは Search Engineering 1。
What's New on the Web? The Evolution of the Web from a Search Engine Perspective
- Alexandros Ntoulas, UCLA
- Junghoo Cho, UCLA
- Christopher Olston, CMU
OpenDirectoryから選んだ150サイト程度を1週間ごとに1年間クロールし、 変化を調べたもの。月末に新しいページが増える率が多いなどなどの 統計情報が多数。で?
Understanding User Goals in Web Search
- Daniel E. Rose, Yahoo! Inc.
- Danny Levinson, Yahoo! Inc.
サーチエンジンのクエリーログを手で調べて、どういう種類のクエリーが どの程度あるか調べたもの。で?
Impact of Web Search Engines on Page Popularity
- Junghoo Cho, UCLA
- Sourashis Roy, UCLA
有名なページほどページランクが増えやすい。すなわち金持ちに 富が集まる効果があるかどうかを1番目の発表と同じデータで 確認した。で?
夜はレセプションとポスターセッション。 田中克己先生、角谷さん、田中浩哉君、NiCTの灘本さんらと遭遇。 NHK放送技術研究所の人で今スタンフォードにいる山田一郎さんを 紹介していただき名刺交換。
北大の藤間さんのポスターは、ウェブアプリを使った、フリースタイル スプレッドシートのようになっておりちょっと使ってみたいかも。
NTTの富田さんのポスターは、ウェブの文書の特徴をグラフの形で表現して グラフのマッチングで検索したりするフレームワーク。面白そう。 武田さんと一緒に議論したり。
2004-05-20
_ [学会] WWW2004二日目
ちょっと外に朝食を食いに行く。近くのデリでベーグルクリームチーズ付きを 食すも引き分け。
聞いた発表についてはぼちぼち書きます。
昼頃、セントラルパークへ散歩に行く。なんてことはない公園だが、 でかい岩というか岩で出来た岡みたいなのがゴロゴロしている。 中には、野球をやってる人や、日光浴をしてる人、ランニングをしてる人などいろいろ。
夜はバンケット。マイケルジョーダンステーキハウスというグランドセントラル駅のなかのレストランで立食で寿司詰め。なんじゃこりゃ。というわけで、吉川先生、波多野さん、RICOHの山本さんらとすぐに抜け出して、食べ直しに行く。 なかなか店が定まらず、話のネタにとMARS2112へ。ターキーラップを食すも敗北。
READMEと日記の書き方