2007-04-03
_ [業界] 英語クエリに対する検索結果の違い
例えば、"lucene"を、google.co.jpとyahoo.co.jpで検索すると、Googleでは日本語のlucene紹介ページがトップに、Yahoo!ではluceneの英語オフィシャルサイトがトップに出てくる(以下参照)。
lucene - Google 検索
英語のオフィシャルサイトを探そうとするときには、Googleの結果は日本にローカライズしすぎていてフラストレーションがたまる。2ページ目、3ページ目に行っても、オフィシャルサイトを出してくれないので、「ウェブ全体から検索」をチェックして検索しなおさないといけない。これが結構手間なのである。日本人にとっては日本語サイトの方が好まれそうなのではあるが、オフィシャルサイトくらいは最初のページに出しても良いのではないか。この点、Yahoo!は適度に英語サイトも混ぜてくれているので使いやすい。WWW2007など国際会議を検索しようとするときも同様の問題が起こる。
最近、検索結果の質はGoogleでもYahoo!でもそんなに変わらないので、デフォルトの検索エンジンをYahoo!に変えようかと真剣に検討中。こういう細かい使い勝手って案外重要だと思う。
2007-04-13
2007-04-16
2007-04-17
_ [業界] 大航海公募結果
モデルサービスの開発と実証に関する公募結果が13日に出ていたことに今頃気が付きました。ドコモと日航が採択されたようです。どんなモデルサービスを開発するのか気になりますね。ところで勘違いされている方がいると困るので一応書いておきますと、私は公募関連については一切関知していませんし、このあたりの開発にたずさわることもありません。
_ [業界] 大航海公募結果についてのITproの記事
以下の記事には、計画されているサービス内容まで書かれてますね。ドコモの「行動連鎖型検索エンジン」はコンシューマ寄りですが、行動履歴を使われるのにはちょっと抵抗のあるところ。ロケーションアウェア、履歴利用検索なんてのは相当昔から言われていることではあるのだけど、ドコモの持ってる膨大な履歴データがあればなにか新しいことができそうなのでしょうか。一方日航のはかなり航空に特化したアプリのように見え、出た結果が分かりにくそうです。
経産省の検索エンジン開発、NTTドコモと日本航空の案を採択:ITpro
ところで、経産省のページにはこんな詳細な情報は無いようで、他のメディアにもこの内容は出ていないように見えます。ITproにだけ流したということなのか、他が無視しているだけなのか...。
_ しましま [個々のデータを明かさなくても,プライバシー保護データマイニングとかの技術ならば面白いことができるかもしれません. h..]
_ とよだ [しましまさん、ありがとうございます。ドコモの場合秘密にする以前にすでにユーザの個人情報を知られてしまっているのであれ..]
_ しましま [GPSの位置情報とかだと,利用者がサービスを利用するときに,そのことを意識してサイトに伝えたりすると思います. です..]
_ とよだ [あ、勘違いしていましたが、プライバシー保護データマイニングというのは、データの送信者を秘密にするのではなくて、データ..]
_ しましま [ごくごく簡単な例で,総和を求める場合です.N 人いるとします. 1) だれでもいいから 自分の値に乱数を足して次の人..]
_ とよだ [わざわざ解説頂きありがとうございます。この例だと、最後に最初の人が結果だけ放送すれば良いわけですね。多数のユーザをサ..]
_ しましま [そうですね,集中管理だと準同型の暗号化関数を使うことになります.著名な研究者は Christopher W. Cli..]
_ キャップ美原 [ご無沙汰しております,ボクも実はちょいと絡むことになっています.とょださんは絡んでいないのですか?確かある資料で名前..]
_ とよだ [しましまさん、大変勉強になりました。どうもありがとうございます。R. Agrawalはホントに色々やってますね。 美..]
_ キャップ美原 [そうなんですよ,大後悔ですよ, 結局この国プロは何なんでしょうね?良く分からない‥それが国プロなんでしょうか こ..]
2007-04-18
2007-04-20
_ [研究] 第2回 ウェブリンク解析の会
脇田さん、宇野さん、近藤さんらとなんとなくはじめた会ですが、今回NTTの風間さん、NICT/ATRの湯田様、藤原様、東工大村田先生、に御参加いただき20名弱での開催となりました。2回目にして意外な大所帯になってしまいました。
湯田様からは、mixiのネットワーク解析と最近の話を少々していただきました。mixiの知り合いネットワークの直径は6程度であり、スモールワールドっぽい。ネットワークをNewmanらの手法でクラスタリングすると、サイズ対クラスタ数の累積割合においてサイズ百から数百の間にほとんどクラスタの存在しない領域(スキップ、ギャップ)がある。この傾向は、高い次数のノードを削除しても変わらない。ネットワーク成長モデルに一定のランダム性を導入すると、べき分布からかなりスキップのある分布の間をカバーでき、その中間あたりにmixiの分布があることが分かる。最初は親密な知り合いの紹介で参入するが、しばらくするとちょっと遠い友人を見つけ、その友人のクラスタと結合するというプロセスで説明できるのではないか。Newmanらのクラスタリングは中程度のクラスタのマージの際に不安定な挙動を示すことがあり、その解析も行っている。
風間さんからは、Ingrid, ODIN, Webからの人間関係抽出など、これまでの仕事のダイジェストをしていただいた後、ブログのトラックバックネットワークの話をしていただきました。入出次数、ページランク、HITS、中心性などさまざまなスコアを計算し、スコアがネットワーク上にどのように分布しているか調査。次数、HITS、中心性はネットワーク中心の密な部分に高いスコアが集中するが、ページランクは広い範囲に高いスコアが散逸する。
村田先生からは、Yahoo!知恵袋における人間関係予測の話をしていただきました。過去の人間関係の推移から、未来の人間関係を予測できるかという話。2〜3割程度あたるらしい。
湯田様、藤原様にせっかく遠いところを来て頂いたので、私もこれまでの仕事をリンク解析よりにまとめた話をさせてもらいました。
学生さんを置いてきぼりにして、議論を色々してしまったのが反省点かも。今後も続けていくことには、皆さんの賛同を得られたように思いますので2ヶ月に1回程度のペースでやっていきたいと思います。まあ自己紹介フェーズも大体終わったので今後はそれぞれの話をできるだけ深く話すような形にしたいなあと勝手に思っています。
2007-04-24
_ [大学] 講義でアンケートをとろうかなあ
明日、電子情報学特別講義という持ち回り講義で話をすることになっています。1時間半持たせるのもつらいので、ある程度人数がいたら、以下のようなアンケートをとってみようかと思っています。何か加えたほうがよさそうな質問ありますか?
- 良く使う検索エンジンは?(Yahoo!, Google, MSN, Goo, それ以外)
- 使っているメールサービスは?(GMail, Yahoo! Mail, それ以外)
- 携帯でやり取りするメールのほうがPCより多いか?(Yes, No)
- 携帯でウェブを見ているか?(Yes, No)
- ネットオークションを使ったことがあるか?(出品、落札)
- SNSに入っているか?(Yes, No, 知らない)
- 自分のウェブページを持っているか?(Yes, No)
- 人のブログを読んでいるか?(Yes, No)
- ブログを書いているか?(Yes, No)
- RSSリーダを使っているか?
- SBSを使っているか?(はてなブックマーク, del.icio.us)
2007-04-25
_ [大学] 電気系大学院生60人くらいに聞きました
挙手によるアンケートの結果です。質問によって答えてくれた学生の数が違っていたり、面倒なので大雑把に数えていたりしますので、まあ大体こんなもんだと思ってください。だんだん回答数が減っているので学生さんも途中で飽きてきているのだと思います。7月に学部生相手の似たような講義があるので、紙にするなど、もうちょっとちゃんとやろうと思います。他の大学でもやってもらえると比較ができて面白そうですが、先生方いかがでしょう。
- 一番良く利用している検索エンジン
- Google: 45
- Yahoo!:3
- その他:0
- 一番良く利用している無料メールサービス
- GMail: 20
- Yahoo!メール:14
- Hotmail:13
- 使っていない:3
- ネットオークションを使ったことがある: 12
- SNSに参加している: 22, していない: 12
- ブログを利用している
- 人のを読んでいる: 15
- 自分で書いている: 5
- RSSリーダを使っている: 3
- 2chなどの掲示板を利用している
- 普段読んでいる: 14
- 書き込みもする: 3
- 利用していない: 15
とまあ、こんな感じ。途中で面倒くさくなっていくつか質問を省略しました。検索エンジンは、一般の統計と違う結果になるだろうと思っていましたが、やはりそのとおりGoogleが圧倒的ですね。無料メールはGMailが一歩リードも差は比較的小さめです。SNS参加者は、全体の1/3、答えてくれた人の2/3くらい。普及してますね。ブログ、掲示板利用者はSNSを下回っています。クローズドな環境のほうが好まれているということでしょうかね。RSSリーダー利用者は予想をかなり下回っていてびっくりしました。みんなどうしているのだろう。
_ 奈良のプログラム解析屋 [某芸大に非常勤で行っているのですが、自分のウェブページを持っている学生が結構居てちょっとびっくり。自作の絵を公開して..]
_ kwakita [昨日、東工大の一年生にメールの使い方を教えながら、アンケートを取りました。 出席者 26名 - 携帯メールを使わ..]
_ kazama [やはり,一年生はまだ一般の人に近いんですね.使っているブラウザとか,ブラウザのホームに設定しているページとかも興味あ..]
_ さね [私も尋ねてみました。対象は学部2年生50人程度 圧倒的にYahoo!でした。ユーザとして、Lightなようです。詳..]
_ とよだ [奈良プロさん、やはり動機があると違いますね。 kwakitaさん、MSNは私のでも結構人数がいてびっくりしました。6..]
2007-04-28
_ [漫画] トニーたけざきのガンダム漫画 II
本屋で続きが出てることに気が付いて即買いした。手にとるとちょっと薄くレジに出したら700円ちょいしてびっくりしたのだが、中を見て納得。なんと100ページ近いカラー印刷でアホみたいに大量のガンプラをつぎ込んだジオラマ実写漫画をやっているんである。しかも神懸り的にくだらないネタばかり。かけている手間と時間がまたすごい。一見の価値は間違いなくあります。シャア専用○○○を見たときには本気で吹いた。1冊目を読んでいない人は、そちらも是非。
2007-04-30
READMEと日記の書き方
_ suzuki [英語なんか読めないよ!な人にとっては,Google のほうが良いかもしれませんね.でも日本の一般人は Yahoo! ..]
_ bun [そうだそうだ。それに「ウェブ全体から検索」をチェックしても7番目だぞ。どうしてインタフェースの言語を日本語にしただけ..]
_ ふくち [英語 google もブックマークしとこう。 http://www.google.com/intl/en/ こっ..]
_ とよだ [もはや乗り換える動機になるほど、検索結果の質の違いはないように思いますね >suzukiさん。 こうなってくると各国..]
_ kazama [Ready2SearchでOpenSearch形式を簡単に作れるので,英語版を追加して切り替えて使うってすぐできそう..]
_ とよだ [おおっ。こんなのがあるとは知りませんでした。ちょっと見てみます。]
_ まつした [普段はgoogleで「ウェブ全体から検索」をon 英語ページを探すときは 「lucene」で検索 日本語ページを探す..]
_ とよだ [うーん微妙に手間ですね。「ウェブ全体」でもgoogle.co.jpでは結構日本語サイトの方が優先されちゃうのがちょっ..]