Posts Tagged ‘service’

関連フィードを検索する LDRLens を作りました

Sunday, May 24th, 2009

関連フィードを検索する LDRLens を作りました。このフィードを読んでいる人は、こんなフィードも読んでいます、というやつです。Bayesian Sets [paper] を使ってみました。

Bayesian Sets については、ほかの方の記事が参考になります(ここここここ …)。高速で、なかなか精度もよくてすごいです。

使用しているデータは、2008/07 頃に livedoor Reader から収集した 136,467 フィード、2,348 ユーザです。
「各ユーザの公開フィードの OPML を収集」、「各フィードを最近購読したユーザをスクレイピング」、を繰り返して収集しました。

フィードのタイトルか URL を入力して「検索」を押すと、部分一致で引っかかったフィードを表示します。同時に、それらのフィードを購読しているユーザと、それらのユーザが購読している他のフィードを表示します。

例えば、http://jra.jp/ で検索すると、競馬関連のフィードが見つかります。

興味があったら使ってみてください。