2009年10月29日

YouTubeを学ぶ「もじもじTV」

もじもじTVというウェブサービスがあるらしいと今日知った。

もじもじTV
http://mojimoji.tv/movies/t1

どういうサービスかと言うと、YouTubeやニコニコ動画などの動画サイトの音声を認識してテキスト変換できるというもの。これが出来るという事は、動画の中身の音声で検索できるという事で、例えば「郵政」についてのニュースを見たいと思ったらキーワードに「郵政」と入れれば郵政と発言している動画の一覧が出てくるという事だ。これまではタイトルや説明のコメントで検索するしかなかったものが、内容に応じて検索できるようになる。これは結構便利かも。

まだアルファ版で、利用するには抽選で選ばれないといけない。
面白そうなので抽選の申込みをしたところ、夕方には当選メールが届いた。


登録してメイン画面にいくと、検索窓のついたページが現れる。

もじもじTVメイン画面


さっそく検索しようと思ったが、特に検索したいものが見あたらない。思いついた言葉を適当に入れてみる。YouTubeでよく見るのは競馬のレース動画なので「競馬」と入れてみたが該当なし。「ガンダム」と入れても該当なし。
どうやら思ったよりも検索ではヒットしないらしい。データの蓄積がまだあまりないのだろう。使ってみてわかったが、動画のアドレスを登録しないと音声認識はしてくれないようだ。通常の検索ロボットが巡回して自動登録するという仕組みではないようだ。それは今後対応するのだろうか。音声認識の精度がある程度上がった時点でそういう仕組みにしてくれないと使いにくいというか世間に浸透しないだろうなあと思う。

とにかく何らかの動画を見てみないと面白くないので、とりあえずヒットしそうなものを入れてみる事にした。今なら鳩山首相あたりならニュース動画も沢山あるし大丈夫だろうと思い、「鳩山由紀夫」で検索したところ3件ほどヒットした。鳩山で3件しかないというのはかなり少なく感じる。
が、問題は中身だ。
所信表明演説の一部を見てみたが、それなりにちゃんと日本語として認識されている。動画の下にテロップがついていて、カラオケのように話の進行につれて文字の色が変わっていく。

もじもじTV 動画再生画面


誤変換がそれなりにあるので、それを手作業で修正していく。鳩ぽっぽ独特の妙に間のあるしゃべり方なので、文節毎に「。」が打たれていて笑える。「脱官僚依存」とか普通に聞いても一瞬何を言っているのかわからないような単語はやはり変換出来ていない。しかし、始めに出てきたものを訂正すると後ろの方で出てきた同じ単語はちゃんと変換されていたので、リアルタイムに修正しているのかも知れない。たまたまかも知れないが。


このサービスはなかなか凄いような気がする。が、まあ、音声認識自体は今更目新しくもない。iPhoneでも音声認識メールというアプリがあるし、パソコンでも随分前に流行った。びっくりする程認識率が高い訳でもない。ソーシャルな学習機能もついていて、誤変換を人力で訂正した結果を蓄積し認識率の向上も図っていく。
凄く目新しいというものはあまり見あたらないが、今までなかったのだから、やはり新しいのだろう。

これは上手く普及したら面白そうだ。動画の検索とかも良いが、Evernoteで音声メモをとった時、ウェブ上でこれを音声認識してテキスト変換してくれるようになったら神なのだが、そういう事はできるのだろうか。単にYouTubeの動画をテキスト変換するだけでなく、クラウド上のデータを変換してくれるサービスにしたら時代が変わりそうだ。会議の議事録を上げておいたら勝手にテキストにしてくれて、しかもすぐにみんなが共有できたら音声データの使い方もまた違ってくるだろう。動画でも然り。
他のサービスなんかと連携して、ただの検索マシーン以上の進化を見せてほしいなあ。

tomo7336 at 00:23│Comments(0)TrackBack(0)clip!

トラックバックURL

この記事にコメントする

名前:
URL:
  情報を記憶: 評価: 顔