トップ «前の日記(2007-04-16) 最新 次の日記(2007-04-18)» 編集

豊田正史のSLとは関係ございません


2007-04-17

_ [業界] 大航海公募結果

モデルサービスの開発と実証に関する公募結果が13日に出ていたことに今頃気が付きました。ドコモと日航が採択されたようです。どんなモデルサービスを開発するのか気になりますね。ところで勘違いされている方がいると困るので一応書いておきますと、私は公募関連については一切関知していませんし、このあたりの開発にたずさわることもありません。

公募(METI/経済産業省)

_ [業界] 大航海公募結果についてのITproの記事

以下の記事には、計画されているサービス内容まで書かれてますね。ドコモの「行動連鎖型検索エンジン」はコンシューマ寄りですが、行動履歴を使われるのにはちょっと抵抗のあるところ。ロケーションアウェア、履歴利用検索なんてのは相当昔から言われていることではあるのだけど、ドコモの持ってる膨大な履歴データがあればなにか新しいことができそうなのでしょうか。一方日航のはかなり航空に特化したアプリのように見え、出た結果が分かりにくそうです。

経産省の検索エンジン開発、NTTドコモと日本航空の案を採択:ITpro

ところで、経産省のページにはこんな詳細な情報は無いようで、他のメディアにもこの内容は出ていないように見えます。ITproにだけ流したということなのか、他が無視しているだけなのか...。

本日のツッコミ(全14件) [ツッコミを入れる]
_ みな (2007-04-17 18:41)

航空会社なのに大航海とはこれいかに :-)

_ とよだ (2007-04-17 19:31)

ドコモも携帯相手ですし、情報大徒歩に大航空?

_ kazama (2007-04-17 20:06)

Googleはすでに行動履歴を使ってますが,それも抵抗あります?

_ とよだ (2007-04-17 20:10)

まだちょっとあります。なのでパーソナライズ版は使ってません。個人同定のできない履歴であればかろうじて。今回のドコモのは物理的な移動履歴まで使おうというものなので、そこはやはり抵抗がありますね。

_ しましま (2007-04-17 21:36)

個々のデータを明かさなくても,プライバシー保護データマイニングとかの技術ならば面白いことができるかもしれません.<br>http://www.acm.org/sigs/sigkdd/explorations/issue.php?volume=4&issue=2&year=2002&month=12<br>安全な計算といって,個別のデータの値は秘密にしたまま,全体の平均値とか,最大値とかを計算する技術です.<br>これを使えば,個々のデータは秘密にしたまま,人の流れの傾向とかを可視化したりできるかもしれません.<br>ただし,データを明かすほど信頼できないけど,プロトコルは順守するという semi-honest という前提が必要です.せめて,全体の半分以上はsemi-honestでないといけません.<br>P2Pとかで使おうとすると,ダミーをいっぱい作ると,この前提をくずせます.で,実際の適用場面がなかなかありませんでした.<br>ですが,携帯とか物理的制約があれば,ダミーを作りにくいので,いいかもしれません.

_ とよだ (2007-04-18 04:41)

しましまさん、ありがとうございます。ドコモの場合秘密にする以前にすでにユーザの個人情報を知られてしまっているのであれなのですが、もしドコモから一部履歴データが公開されるようなことがある場合にはこういう技術が役に立つかもしれませんね。

_ しましま (2007-04-18 09:01)

GPSの位置情報とかだと,利用者がサービスを利用するときに,そのことを意識してサイトに伝えたりすると思います.<br>ですが,プライバシー保護協調フィルタリングだと,常時取得しても,個々の端末の位置は秘密になるので,問題が生じないとかという点はちがうのではないかと?<br>どうでしょう?

_ とよだ (2007-04-18 14:58)

あ、勘違いしていましたが、プライバシー保護データマイニングというのは、データの送信者を秘密にするのではなくて、データそのものを秘密にできるのですね。だとするとモバイルでの推薦には面白い使い道がありそうですね。何でそんなことができるのか不思議なので後でちょっと読んでみたいです。

_ しましま (2007-04-18 16:22)

ごくごく簡単な例で,総和を求める場合です.N 人いるとします.<br>1) だれでもいいから 自分の値に乱数を足して次の人に送ります.<br>2) 受け取った人は,知らない乱数が加わっているので,前の人の値は分かりません.で,受け取った値に自分の値を足して次の人に送ります.<br>3) 最後の人は,自分の値を足して最初の人に送ります<br>4) 最初の人は,始めに足した乱数を知っているので,それを引けば,みんなの総和になります.<br><br>もっと強固にするには,暗号化関数が,線形の演算などに対して準同形の性質があれば,元の値を足した値を暗号化したものが,それぞれの値を個別に暗号化した値を足したものになるので,秘密にしたままいろいろないろいろな計算ができます.これらを組み合わせて,相関ルール抽出,決定木,クラスタリング,はずれ値検出などが行われています.<br><br>semi-honest仮定が必要なのは,例えば,自分以外がみんな共謀していたら,秘密になりません.ですが,携帯電話なら,何100台ぐらいニセモノを潜らせても,多数決によって怪しいやつをはじき出すとかの技術でどうにか排除できるらしいです.

_ とよだ (2007-04-18 19:29)

わざわざ解説頂きありがとうございます。この例だと、最後に最初の人が結果だけ放送すれば良いわけですね。多数のユーザをサーバで集中管理するようなサービスだとまた違う手法が要りそうですが、そういう場合に準同形の暗号化関数を使うのでしょうか。相関ルール抽出までできるのはちょっと驚きですが、それなら色々使えそうですね。

_ しましま (2007-04-18 22:14)

そうですね,集中管理だと準同型の暗号化関数を使うことになります.著名な研究者は<br>Christopher W. Clifton http://www.cs.purdue.edu/people/clifton ホームページにはいろいろ資料があります.<br>あとは Apriori の R. agrawal <br>http://rakesh.agrawal-family.com/pubs.html#privacy がいます.<br>agrawal の方は,安全な計算ではなく,ランダム化という手段です.独立な平均が0の正規分布ノイズをみんなが自分の値に足してサーバに送ります.サーバでは,送られてきた値の総和をとると,サンプル数が十分ならば,ほぼ正しい総和になります.また,個々の値は乱数が足されているので秘密にできるという仕掛けです.

_ キャップ美原 (2007-04-19 01:48)

ご無沙汰しております,ボクも実はちょいと絡むことになっています.とょださんは絡んでいないのですか?確かある資料で名前を拝見していたのですが‥<br><br>このプロジェクトの背景では,色々とありますが,まぁあまり流れに飲み込まれないようにしないといけないですね<br><br>先ほど「絡む」と書きましたが,稼働の80%はこのプロジェクトに注ぎ込まれる予定です.結構絡みます‥

_ とよだ (2007-04-19 02:55)

しましまさん、大変勉強になりました。どうもありがとうございます。R. Agrawalはホントに色々やってますね。<br>美原君、爆発ではなくて大航海ですか?

_ キャップ美原 (2007-04-21 01:37)

そうなんですよ,大後悔ですよ,<br><br>結局この国プロは何なんでしょうね?良く分からない‥それが国プロなんでしょうか<br><br>この件でいろいろネタ出しをしなければいけないんですよ〜<br><br>どこかでお会いする機会がありましたらよろしくお願いいたします.


README日記の書き方