2008年08月27日

なぜ「音声入力」は普及できないのか?       (NO.95)

a60b047e.jpg   このブログの創刊号は、2006年8月31日の刊行です。ちょうど、満2年が経過したことになります。この間、おかげさまで94回、原稿の投稿をすることができました。一つのテーマに絞って、よくぞここまで続いたものだ、とわれながら感心しています。

  でも問題は、むしろこれからです。この先も、読者のみなさんから、満足できる「音声入力」に関する有効な情報を引き続いて発信している、と評価されれば、このブログを継続する価値があるでしょうが、もしそうでなかったら、その時は潔く、このブログを閉鎖すべきと考えています。

 私が当初「音声入力」の中に見つけだした魅力が本当に期待通りのものだったのか、そうだったとしたらそれはどういう形で現在私はそれを実現しているのか、という点を中心に、これから数回にわたって説明してまいります。


(1)なぜ「音声認識ソフト」は普及できなかったのか?

私が「音声入力」に興味を覚え、これを徹底的に研究してみようと思いたった理由は、今から約8年前にIBM社から発売されたViaVoiceという音声認識ソフトが、あれだけ大々的な宣伝を行ない、多くの人の期待を一身に集めた商品であったのにもかかわらず、その後、人気を失い、そして今や話題にものぼらない商品になってしまった現象に大きな疑問を持ったからです。

 不人気になった原因は何か?それを解明をしてみよう、できることならば、そこからこのソフトを復活させる方策を探ってみよう、というのが私の関心事でした。しかし、調べてみると、問題はかなり複雑なものでした。

 この開発活動のストーリーを記録に残す意味から、これをブログの形で発表してみようと思い立ちました。
そのブログの当初のものを読んでみると、肝心の音声認識率のことには触れずに、ソフトメーカーが指定するマイクとか、その修正機能が不十分であることを強調し、それらの問題にユーザーの信頼を失わせた原因があった、と私は説明しています。

 あれから、2年間近くいろいろ試行錯誤を重ねた結果、今では、マイクとか修正機能が不十分なために、このソフトが普及できなかったとは申しあげません。全く違う、もっと基本的なことが原因だとわかったからです。その原因は、このソフトを使っての文章作成法そのものにありました。この点について、以下、もう少し詳しく説明を加えます。

 すでに、このブログで何回も説明している「逐一変換方式」と「全文一括変換方式」をもう一度ここに登場させていただきます。

 「逐一変換方式」とは、頭に浮かんだ考えを文章で表現するとき、それを「手書き」法で紙に記していく、一段落するとその続きをまた考え、それを書き加えていく方法です。この積み重ねで、文章を作成する方法です。「手書き」法以外にも、今広く普及しているパソコンのキーを打って文章作成する「キー入力」法も、同じ原理で作業する仕組みです。

 もう一つの「全文一括変換方式」は、「逐一変換方式」とは全く違う方法です。手を使うのではなく、考えをマイクに向かってしゃべることで原稿を作ります。今までしゃべったことを、途中で、文章にして確認することはできませんで、最後までしゃべり通します。

 しゃべり終わったとき、この音声ファイルをパソコンにダウンロードいたします。そうすると、音声認識ソフト機能とドッキングして、自動的に文章が作成できます。私たち日本人には馴染みのない方法ですが、欧米では昔からある、ディクテーション(口述筆記)という名称で知られている文章作成法です。

 この「逐一変換方式」と「全文一括変換方式」を使って説明を続けます。
ここで取り上げた、音声認識ソフトの使用法そのものが、その製品の普及を妨げた原因であったとの説明は、多分、読者の皆さんには初耳のもので、少なからず驚かれたことでしょう。私もこの原因を突きとめられたことで、この先の対策を明確に立てられるようになりました。 
 
 ここで改まって強調したいことは、「音声入力」で文章作成をする以上は、従来の文章作成法とは全く違う方法で、その特徴を発揮できる新しい使い方をすべきだということです。ところが、その特徴が全く生かされてこなかったことが、今までの音声認識ソフトの使用法だったのです。

 もう少し具体的に説明いたします。音声認識ソフトの使い方の基本型は、パソコンの前に座り、マイクに向かって「逐一変換方式」で音声をしゃべるやり方です。これは、基本的には、「手書き」法とか「キー入力」法と同じやり方です。その結果、「音声入力」法の特徴は、キー入力で文章作成をするところを、単に音声でしゃべるだけでして、文章作成法は、基本的に「キー入力」法と同じやり方なのです。

 そうなると、「キー入力」法と「音声入力」法は、常に同じ土俵の上で勝負することになります。原稿のパソコンへの入力では、「音声入力」の方が一般的に早くても、修正作業が加わると、結局のところ、「キー入力」法に軍配が上がるとか、ほぼ同じとか、そういう単純な比較が可能です。この比較では、よほど決定的な差がない限り、従来の「キー入力」法から新参の「音声入力」法に鞍替えするケースはありえません。結局、この比較で決定的な差が出せなかったことが、「音声入力」法が低迷した理由です。

 では、「音声入力」法とはそんな程度の性能なのでしょうか?いや違います。「全文一括変換方式」での使い方は、「キー入力」法とは全く違う方法での文章作成法です。せっかくこのようなユニークな、「音声入力」法でなければできない文章作成法があっても、それを中心的に紹介せずに、従来と同じ枠の中で「音声入力」法を扱ってしまったメーカーの姿勢が、こういう結果を引き起こしてしまったのです。  
これは、メーカーの大きなミステークと言っても過言ではありません。

 なぜ、これほど基本的で、重要な問題がないがしろにされてきたのか、考えてみる価値があります。それには、日本語ワープロの「キー入力」法が誕生した時の経過を考えると、納得できる共通項があります。
 
 (2) 日本語ワープロの大きな欠陥

 今から約30年前、日本語ワープロが誕生した時、そのキー入力法をめぐって、ペンタッチ方式(邦文タイプライター方式)か「キーボード」方式とかで、メーカー間で激しい競争がありました。その結果、「キーボード」方式が主流を占め、それが今日のパソコンでの「キー入力」法に結実しているわけです。

 この日本語ワープロが開発されたことで、私たち日本人は、これで欧米に普及している書くためのマシン「タイプライター」を獲得できた、日本語タイプライターが完成したと信じました。(私もそう信じた一人です)ところが、年月をたって冷静にこのマシンを検討すると、これは文章を書くマシンというよりは、日本人の文章作成においてもっとも厄介な漢字なる文字を処理するためのマシンであることが明らかになりました。

 このマシンを使えば、確かに「手書き」法よりは数倍の生産性で文章作成は可能ですが、現代の日本人が必要とする文章作成マシンとしては、残念ながら、大変に見劣りいたします。

 私たちは、日本語ワープロによって漢字処理が簡単にできるようになった、と喜んできましたが、漢字を処理する基本的な仕組みは、「漢字変換キー」です。ひらがなやローマ字で入力した文章を、この「漢字変換キー」を打つことによって、はじめて漢字の世界に入り込むことができる仕組みを作ったのです。

 しかも、その際に、実に巧妙な仕組みとして、そこで使用する漢字の選定をユーザー自身に任せたことです。「漢字変換キー」を打って出てくる漢字一覧表から、正しい選択はユーザーのオプションにした点が、極めて巧妙な仕組みなのです。私たちは、このマシンで文章作成問題は解決できた、と錯覚してしまったのです。

 ところが現実は違うのです。文章作成の方法と漢字処理の方法とは全く異質の問題でして、私たちは漢字処理の難解さに辟易していたばっかりに、この日本語ワープロが文章作成マシンとしてどれだけの機能を持っていたのかを正しく評価できないできてしまったのです。ですから、今なお、文章作成に苦手意識を持つ人たちがたくさん存在しています。日本語ワープロが普及したと言っても、文章作成には役立てられない人がたくさんいる現状なのです。

 それでも、この日本語ワープロを使って、「全文一括変換方式」のやり方で文章作成する方法がありました。それは、ひらがな入力で文章作成をした場合、その途中で「漢字変換キー」を封印し、最後までひらがなだけの文章作成を、キー入力で実行いたします。その文章が完成した段階で、「全文一括変換方式」で漢字表記をさせるというソフトを活用する方法です。残念ながら、それは技術的には可能であっても、そのやり方は全く普及しておりません。

 おそらく、この日本語ワープロ開発の技術者の中には、「全文一括変換方式」による文章作成法で、ワープロマシンを操作する仕組みを考えた技術者が存在したはずです。しかし、多くの開発マンが参考にしたのは、その時存在していた「手書き」法に則った使用法だったのです。文章を書くとしたら、「手書き法」が基本であると誰もが信じて疑わなかったのです。
 
 ここで、なぜ日本語ワープロを参考にしているのかといえば、日本語ワープロの構造には、文章作成の面で、非常に大きな欠陥があることを知っていただきたいからです。端的な例をあげれば、パソコンの前に座ると、素敵な文章が、簡単に作成できるという構造になっているでしょうか。頭の中に浮かんだ考えを上手にキーの上に移す機能があるでしょうか。残念ながらそんな機能は全くありません。

 誰もが簡単に、手軽に文章を作成するためのマシンが、書くために一番必要で、重要な機能のはずです。でも、日本人が日本語ワープロに頼らざるを得ないのは、厄介な漢字を処理する上で、極めて便利なマシンだからなのです。この点を良くわきまえないと、せっかくの新しい技術がこの先文章作成用としていろいろ登場しても、宝の持ちされになります。その典型的な例が、「音声認識ソフト」ではないかと申し上げたいのです。

 (3) 文章を上手に書くコツは?

 ここで誤解のないように申しあげます。それは、「音声入力」の作業において、従来の「逐一変換方式」の使い方を全面的に否定しているわけではないことです。私自身、「音声入力」の作業中には必ず「逐一変換方式」での使用法を活用しているからです。しかし、それには使用する順番があることを強調したいのです。

 まず、表題に示した「文章を上手に書くコツ」には、私なりに自信を持ってお勧めしたい方法があります。そのコツとは、
  仝狭討硫悉颪(草稿・ドラフトとも言います)を まずは「音声入力」で作成します。「全文一括変換方式」での入力です。
 ◆,修硫悉颪を元にして、「逐一変換方式」で文章の推敲(校正)作業をおこないます。もちろん、この場合も「音声入力」での作業です。
  最後は、もう一度推敲作業をおこないます。この場合は、「キー入力」法が最適です。

 ここで掲げた上手に書くという「上手な」文章については、注釈を加えておく必要があります。

 広く一般的に言われている上手な文章とは、読者に感動を与える類のもので、それは小説とか、エッセーとかの文芸作品に多く当てはまるものです。しかし、私がここで考える「上手な」文章とは、そういうものとは一線を画する文章です。

 すなわち、だれが読んでも理解できる、正確で、明快な文章のことを指します。ビジネス、科学、技術などで、広く一般的に書かれている文章が対象となるものです。しかもそれに加えて、「上手な」文章とは、スピーディーに作成された作品であることが、現代では強く求めている要素です。

 ´↓の作業を経れば、たいていの文章が、すいすいと面白いように作成できます。次号では、その具体的な使用法をあげて、「音声入力」によるユニークな文章作成法がどれだけ魅力的なものかを、より具体的に説明させていただきます。


この記事へのトラックバックURL

この記事へのコメント
shaktiです。こんにちは。

>文章作成の方法と漢字処理の方法とは全く異質の問題でして、私たちは漢字処理の難解さに辟易していたばっかりに、

漢字処理変換の面倒臭さなどから、、作家の清水 義範は、ワープロよりも手書きの方が作文を書くときにはよいと書いております。この名前は残念ながら今すぐには出てきません。本当に書きたいと思っている文章が、機械によって制限されてしまうと言うのです。手書きならばとりあえず平仮名で書けばよいわけですから、なるほどと思います。

文章の趣旨は、全体として賛成です。その上で、異論を書いておきます。


>でも、日本人が日本語ワープロに頼らざるを得ないのは、厄介な漢字を処理する上で、極めて便利なマシンだからなのです

これについては、少々異議があります。ワープロの便利なもうひとつの側面は、編集が容易にできるということです。これとの関連で、


> 仝狭討硫悉颪(草稿・ドラフトとも言います)を まずは「音声入力」で作成します。「全文一括変換方式」での入力です。

いきなり原稿の下書きがすらすらと声で出てくるのか、という問題があります。調子よく出てくるときはよいのですが、そうでないときは、ちょっと大変です。

また、文字で確認しながら文章を書いて行かないと、不安な場合もあります。

したがって、音声認識による作文技術としては、メモをどうやって文章にしていくのか、ということまで考える必要はあるかと思います。
Posted by shakti at 2008年09月01日 12:11
Shakti さま、コメント ありがとうございました。

 Shaktiさんは、音声認識ソフトによる作文方法に、メモの活用の必要性をご指摘になられています。これは、とても賢明な方法だと思います。
 あらかじめ口述することの要点を、メモの形で箇条書き
しておき、このメモに従いながら内容をより詳しく口述していくことが、音声原稿を上手に作るコツです。

 口述が始まると、その内容の確認が文字を通してできなくなる恐れがある、とご心配されていますが、そんな心配は無用です。
 口述がスタートし、それに集中すると、脳のある部分が活性化するようです。うそみたいに、いろんな考えや、思いつきが続々と湧き出てきます。これだけは、実際にやってみないことにはわからない不思議な現象です。

 考えたことをすらすらと書く、という現象は、まさにこの口述するやり方をしてみて始めて実感できる技術です。これもまた、体験しない限り理解できない現象です。

 
Posted by 石田 民雄 at 2008年09月03日 21:37