IN THE PLEXを読んで気づいた単語を変数としたランキング手法。

IN THE PLEXを読んで気づいた単語を変数としたランキング手法について書きます。

今日とある本屋さんで買ったIN THE PLEXの邦訳を読んでいたのですが、単語を変数にしたランキングについてすごい事に気づきました。

もしすべての単語に重みを設定して、それを使ったアルゴリズムを考えれば、Googleのラリーページなどが考えたようなランキングができるのです。

実際、僕は前から単語に重みをつけるランキング手法を実装していたのですが、すべての単語(何億個でしょうかね?)に重みをつければよい事に気づいたのです。

これは自動的にしてもよいのでしょうし、ある程度テンプレートを作ってから自動化してもよいのでしょう。とにかく、この方法をMohawkに本格的に実装しようともいます。