September 07, 2013

アニメ声の音声合成Webサービス

 新技術のスッパ抜きには定評のある、yonekenです。
 嘘です。
 先日、第31回日本ロボット学会学術講演会NICTの杉浦さんが発表された、「非モノローグ音声合成」こと、アニメ声合成Webサービスが、深く僕の心を揺さぶったので紹介します。


 杉浦さんは昔から、人にサービスを提供するロボットの開発をされていたそうなのですが、いつも既存の音声合成アプリケーションから生成される無機質な声に不満を持っていたそうです。誰だって、無機質な声で道を案内されるより、もっと感情のこもった・・できれば、感情のこもった女の子の声で案内して欲しいと思うだろうと、杉浦さんは考えていたそうです。
 そこで、妄想が妄想で終わらないのがエンジニア。NICTと言えば、21言語対応の翻訳コンニャクこと音声入出力で会話ができる音声翻訳ソフトウェア“VoiceTra”と、文字入力の翻訳ソフトウェア“TexTra”を作った組織です。妄想と技術が出会ったとき、そこに新しい未来が生まれました。

 そうして生み出されたのが、このアニメ声合成Webサービスです。だと思います。
 使い方は、とっても簡単。http://rospeex.ucri.jgn-x.jp/nauth_json/jsServices/VoiceTraSS というURLに対して、POSTで {"method" : "speak", "params" : [language, message, "*", "audio/x-wav"]} を投げるだけ!
 そうしたら、サーバーの方からBase64エンコードされたwaveが送られてくるので、HTML5のAudioオブジェクトにそのまま放り込めば、もう再生できます。
 jqueryによるコードのサンプルは、こちら。
function playVoice(language, message){
	$.ajax( {
		url : "http://rospeex.ucri.jgn-x.jp/nauth_json/jsServices/VoiceTraSS",
		data : {
			method : "speak",
			params : [language, message, "*", "audio/x-wav"]
		},
		dataType : 'jsonp',
		jsonp : 'callback',
		cache : false,
		success : function(data) {
			console.log(data);
			if( data['error'] == null ) {
				audio = new Audio("data:audio/wav;base64," + data['result']['audio']);
				audio.play();
			}
		},
		error : function(XMLHttpRequest, status, errorThrown) {
			console.log(status);
			console.log(errorThrown);
			console.log(XMLHttpRequest);
		},
		complete : function(XMLHttpRequest, status) {
			if( status != "success" ) {
				console.log("Voicetra Server Error : ", status);
			}
		}
	});
}
 このサンプルを用いた、実際に動作するサンプルは↓です。しゃべらせたい文章を入力して、言語を選んだら、「合成」をクリックしてください。

 languageには、今のところja, en, ko, zh, zh-CN, zh-Hansが指定できるようです。対応言語は、同じURLに{"method" : "getSupportedLanguages", "params" : []}を投げれば確認できます。発表によると、声質も、アニメ声と普通の声を切り替えられるようになっているらしいのですが、現在のところ方法は非公開。元々、京都観光案内対話コーパスと言う、京都の観光案内を行うサービス用に開発された対話パターンライブラリを使用しているため、苦手な言い回しもけっこうあるようです。

 ライセンス等、詳しいことは後にNICTから正式にアナウンスが出ると思いますが、直接お聞きしたところ、研究用途に限り無償利用可。商用には別途相談とのことでした。
 なお、このWebサービスは、NICT肝入りのクラウド音声翻訳サービスがバックボーンについているとのことで安定性についても、自信があるそうです。・・の割には、Twitterでつぶやいた直後に「落ちている」って話も聞いたんですが。。

 技術の紹介については以上です。論文によると、二人の声優さんに掛け合いをしてもらいながら収録した音声を使っている〜とか、書いてありましたが、私はそっち方面は詳しくないので、誰か頼んだ。
 あと、こういうサービスは、擬人化された途端に爆発的に伸びると相場が決まっているので、それも誰か頼んだ。
 この研究は、今年のイグ・ノーベル賞のノミネート対象になれるはずなので、そこは杉浦さん頼んだ、・・と思ったら、もう今年度は終わってたのね。。

 最後に、特に意味はないんですが、この声にしゃべって欲しいセリフを色々並べてみました。うぅむ。ここまで来ると、男性版も欲しくなるな。

女性に一度は言われてみたいセリフランキングより






男性が選んだ言われたい告白の台詞ベスト10!!より












P.S. あぁ、そうそう。このシステムは、音声採取に1ヶ月、ラベリングにさらに2ヶ月もかかっているらしいのですが、ここまで手をかけておいて、杉浦さん自身は、別に声オタでも特にアニメが好きなわけでもないそうです。


トラックバックURL

この記事へのコメント

1. Posted by 59naga   September 17, 2013 00:25
「いやらしくお願いします」に変えて延々連打してる楽しい

この記事にコメントする

名前:
URL:
  情報を記憶: 評価: 顔   
 
 
 
現状報告
 OSSのプリント基板CAD「KiCad」の解説本を共同で執筆しました.(2014/06/25)

自己紹介
yoneken
logo
 ロボットの研究・開発をしています。

続きを読む

連絡先は
ad

Syndicate this site
 2012年からKiCad日本語版バイナリのメンテナもしています.
来てくれた人たち
  • 今日:
  • 昨日:
  • 累計:

ショップリンク
嬉しいコメント
記事について
 このブログ記事の著作権は全てyonekenに属します。
 転載や個別記事へのリンクはご自由にどうぞ。連絡は必要ありません。
 記事の内容は無保証です。古い記事の内容は当時と状況が変わっている場合があります。
 内容に関する質問はコメント欄でもらえると、他の人にも役立ちます。
記事検索
月別
リア友リンク