2009-03-22
_ [研究] TopHatenarとフィードクロールデータとの比較
TopHatenarというはてなのブログランキングが全ドメインに対応したので、こちらで取っているフィードクロールデータを用いて入次数ベースのランキングを作ってみた。このデータは100万以上のフィードをほぼ毎日取得して貯めているもの。上位10位ランキングは以下のようになった。
- http://blog.livedoor.jp/dqnplus/
- http://japanese.engadget.com
- http://thinkprogress.org
- http://news4vip.livedoor.biz/
- http://www.akibablog.net/
- http://arstechnica.com
- http://alfalfa.livedoor.biz/
- http://michellemalkin.com/
- http://www.lifehacker.com/
- http://blog.livedoor.jp/dankogai/
ITmediaなどウェブマガジン系は消してブログのみにしてある。100位くらいまで眺めてみたけど、傾向が少し違うようだ。後でもう少し詳しく見てみようと思う。
2009-03-26
_ [研究] レンコンと情報信憑性
ある日の話。母親が「煮ると黒くなってしまうレンコンがあるが食べても大丈夫なのか検索エンジンで調べてみた」と言う。おお、とうとうそんなことができるようになったかと感動しつつ続きを聞くと、「大丈夫と書いてあるページが見つかったが、よく見ると普通の人が書いている。専門家の書いたものは見つからず信じて良いものかわからない」とおっしゃる。確かにそうだよねえ、うーんと唸ってしまった。素人が何人OKと言っても一人の専門家の言葉にはかなわないこともある、という至極当たり前の話ではあるのだけれど、どこかの農学部の先生が大丈夫と書いていたとしてもそれを信じて良いのかという疑問もあるしなあ。結局この手の話は、情報処理で何とかできるものではないよね、というと某所からお叱りを受けるだろうか。かといって、知識を集積する適切なソーシャル的仕組みを作ればよいかというと、現状ではWikipediaを見てもQ&Aサイトを見ても、テキトーな知識が放置されていてあまりうまくいっているようには思えない。特にQ&Aサイトは質問がクローズされてしまうと訂正すらできないわけで、謎のベストアンサーが蓄積されていって良いのだろうかと思ってしまう。という訳で、結論は特にありません。あしからず。
READMEと日記の書き方
_ あずま [へえー]