この頃考えている事、ビジョン。

この頃、Perlで単語の頻度分析とかやっていますが、今度、TwitterのTrends(トレンド)に上っているハッシュタグの単語分析とかをやってみようかなと思っています。

これで時間系列のデータベースに入れて分析するという。

Twitterは今では凄くメジャーになっていて、アメリカのティーンエイジャーたちのあいだではFacebookよりもTwitterのほうが人気とか言う記事を最近読みました。

リアルタイムに起こっている事の情報量はオープンなTwitterに軍配があります。

AWSの2TBのSSDインスタンスを使ってどんどんツイートを分析用に保存したいなとか思っていますが、なにしろ、値段が高いですからね。だったら、自社サーバで1TB SSD x 2 RAID 0にしてなにかのマシンに接続したほうが、安上がりですね。

僕は今の所そこまでの大容量SSDを導入する予定はありませんが、資金調達ができれば、もちろんする予定です。後2,3年待てばもっと大容量の物が買えますしね。

僕はTwitterの気軽さがとても気に入っています。
Facebookだと、常にFacebook上の友達の視線を気にしなくてはいけないような気がするので、あまりなんでも書き込めない感があるのです。

ですが、Facebook上のコネクションを分析したいとも思っていたりします。

この頃、ソーシャルウェブが発達して、マイニング技術もどんどん発展していますよね。僕が気になってる技術はCouchDBとMongoDBです。

CouchDBは今年中に有る程度出来るようになりたいと思っています。

後、専門用語(キーワード)自動抽出サービス、「言選Web」と言うのを見つけました。

http://gensen.dl.itc.u-tokyo.ac.jp/gensenweb.html