2005-01-28
_ [研究] IT Proに「情報処理」のデータマイニング特集の紹介記事が
第一線IT研究者のトレンド斜め読み「第6回 データ・マイニングの最新アルゴリズムで,大量データを有効活用」という記事がIT Proに出てました。私も記事を書いた「情報処理」のデータマイニング特集の概要紹介です。
READMEと日記の書き方
第一線IT研究者のトレンド斜め読み「第6回 データ・マイニングの最新アルゴリズムで,大量データを有効活用」という記事がIT Proに出てました。私も記事を書いた「情報処理」のデータマイニング特集の概要紹介です。
個人的にはなぜカーネル法+Support Vector Machinesがテキスト分類に特に有効と言われてるかが興味深い。<br>ウェブマイニングはbioinformaticsと違ってcomputer scientistが主役だからよいね。<br>ただ、どういうビジネスになるのかは気になるね。ツタヤ&はてなの個人情報利用などが物議をかもしたし。アメリカ共和国の体制批判者捜査などもいやらしいし。
SVMが良いというのは私も気になってて何人かに聞いてみたこともあるけど、どうも理由は良く分からないらしい。<br>マーケティングやさんは、夢の全数調査がウェブである程度可能になるのでは、とblog等に注目しているようなのだけど、まだウェブにはだいぶ歪みがありそうだよなあ。今後どんどん現実との差は小さくなっていくと思うけど。
SVMは実際使ったこと無いんだけど、先日ちょうど「お笑い★★★★」と併せてKernel Learningの本も発注したところです。ウェブマイニングへの応用の章もあったはずなので、読んでおきます。
おぉ、読後の感想をよろしくお願いします。
SVMと聞いて、Simple Virutual Machine…きっと、スタックもないんだろう…でも、なんでこんなものが学習と関係あるんだ…と最初思った、のは秘密です。<br><br>是非、私にも教えてください。
秘密って、思いっきりバラしてますがな。<br>かく言う私も、全然SVMには詳しくありません。
SVMってマイミクで自然言語やってた人が勉強していらっしゃったんだけど、深いところを突っ込むと多様体とか座標変換とか出てくるみたい。(その人もその時点では良く分かっていなかったので「おいらフィルタ」を通すとさらにいい加減な話になるのだが)でも実際使っている人はそういう知識が無くても無問題みたいだ。うわあい、オチが付いたような付かないような。おっほん、でも、なんか最近情報の世界でも数学と関係ありげな話は多いよね…というわけで、まずは微分形式だ!!(やっぱりオチは付きませんでした)
お笑いの好きなとよだくんに普通に突っ込まれてしまったので、ちょっとまじめに書いてみるなり。<br><br>kernel trickとかは思い切り数学になっていて、プログラマにはつらいものがあります。<br><br>一定水準以上は、バックボーンを知らないと…というのはよいとして、ナンちゃってレベルだと(たとえがよいかどうかわからないが)GAくらい、コンポーネントにできるようだと、いろいろ使いであってうれしいのだがどうなのでしょう?(とりあえず、camlのモジュールにしていろいろ実験もできそうだし。) あずまくんが次回(なんの?)にレクチャーしてくれるのかな??