2008年07月20日

協調フィルタリングによるレコメンド計算

このエントリーをはてなブックマークに追加
自分と似た嗜好の人をもとに情報の選択を行う 協調フィルタリング システムにおける、計算方法です。

Amazonでお薦めの本とか、が、表現系として最もわかりやすいシステムです。

GroupLensが初期のシステムで、割とシンプルな考えに基づレコメンド機能です。


基本的に、ユーザは各アイテムに点数を付けていくものとします。
利用ユーザ(あなた)が、まだ点数をつけていないアイテムに対して、どの程度の得点を付けるかを予想するのです。


インターフェイスの街角(93) – 本棚演算
UNIX MAGAZINE 2005.12 増井俊之

ユーザaのアイテムiに対する点数を aiと表記しています。


2008y07m20d_092815372



2008y07m20d_092827292.jpg




相関係数は、 共分散 Cov(a,b) ÷ a,bの標準偏差 の積です。

これは ユーザ a , ユーザ b の評価にどの程度のずれがあるのかの値です。

普通は、正の相関がある評価者が高く評価しているアイテムは、 あなたも高い得点を付けると思いますが、
逆に嗜好が正反対の、負の相関がある評価者が低く評価しているアイテムは、やはりあなたは高い得点を付けるだろうと思うのです。



2008y07m20d_103231831.jpg


a予測値 i とは、ユーザaが、アイテムiに対してつける得点の予測値です。

基本的にはこれだけです。
予測値 の降順に i を並べ替えて表示すればいいと思います。




今回は、1 月号で紹介した「本棚.org」の書籍情報を活用し、協調フィルタリングなどの計算をおこなうシステムを試作してみました。


............


萌え本 の検索

今度は、同様の計算を''萌え専科の本棚''に適用してみましょう。
''萌え専科の本棚''には図3 のような本が登録されていますが、ここに含まれていない''萌え本''はまだまだたくさん
あると思われます。そこで、以下のスクリプトを用いて、私への推薦本の計算と同様の方法で未登録の''萌え本''を計算してみましょう。


2008y07m20d_091853323.jpg

トラックバックURL

コメントする

名前:
URL:
  情報を記憶: 評価:  顔   星
 
 
 
adsense
Categories
サイト内検索
にほんブログ村 科学ブログへ
にほんブログ村

amazon
Profile
Archives
blogchart
QRコード
QRコード
Recent Comments