2006年09月01日
クチコミサーチ
WiPiという興味深いサイトを偶然見つけました.blogなどで誰もが自由に情報発信するようになったので,商品を購入する際にこれらのクチコミ情報を商品選択の判断材料にしている人も多いと思います.
でも,Googleなどで探している商品についてのクチコミ情報だけを探すのは結構たいへんです.この面倒な手間を省いてくれる(可能性がある)のがWiPiです.このサイトでは,さまざまなblogに掲載されている商品のクチコミ情報を一覧表示で見ることができます.
最も興味深いのは,ブログの記事内容から,その著者の商品に対する善し悪しのイメージを自動的に★の数で表示する機能です.この仕組みについての詳細は説明されていませんが,おそらくテキストマイニングという手法を使っていると思われます.この手法,大雑把に言えば記事の中に「良い」とか「面白い」というようなポジティブな言葉がどの程度含まれているか,あるいは「だめ」とか「最悪」というようなネガティブな言葉がどの程度含まれているかを数えて,その著者の評価を自動的に計算します.もちろん,こんなに単純な話ではなく,「良い」という言葉がどの単語に係っているか,「面白いとは言えない」というような否定表現がないかなど,文章の構造を分析する複雑な技術が必要になります.
さて,自動計算された評価値の精度ということになると,まだ課題が多いようです.私が書いたこの記事も『素数の音楽』という本のクチコミ情報として掲載されていて★★となっています.記事の中で「感動」という言葉があるので,ここからポジティブな方向に評価されたのだと思います.しかし,著者の私の気持ちとしては,この本の評価は★★★★ぐらいなのです.記事の中で本の評価についてほとんど触れていないことが原因だと思いますが...もちろん的確に評価できる場合もあって,こちらの記事で書いた『ウェブ進化論』についての評価は私のイメージに近い★★★★となっていました.
同様の試みとして,東工大の奥村研究室によって開発されたblogwatcherというものもあります.こちらは技術的な情報もかなり公開されています.楽しそうな技術でいっぱいです.
テキストマイニングについて知りたいという方は,全体像を掴むために『次世代データベースとデータマイニング』を読んでみるとよいかもしれません.ただし,工学色が強いので,ちょっと気合いが必要です.


