関連フィードを検索する LDRLens を作りました
Sunday, May 24th, 2009関連フィードを検索する LDRLens を作りました。このフィードを読んでいる人は、こんなフィードも読んでいます、というやつです。Bayesian Sets [paper] を使ってみました。
Bayesian Sets については、ほかの方の記事が参考になります(ここやここやここ …)。高速で、なかなか精度もよくてすごいです。
使用しているデータは、2008/07 頃に livedoor Reader から収集した 136,467 フィード、2,348 ユーザです。
「各ユーザの公開フィードの OPML を収集」、「各フィードを最近購読したユーザをスクレイピング」、を繰り返して収集しました。
フィードのタイトルか URL を入力して「検索」を押すと、部分一致で引っかかったフィードを表示します。同時に、それらのフィードを購読しているユーザと、それらのユーザが購読している他のフィードを表示します。
例えば、http://jra.jp/ で検索すると、競馬関連のフィードが見つかります。
興味があったら使ってみてください。

