2010年03月10日

実によくなじむッ! 1日10円で“至高の”日本語入力環境を――まだまだ進化する「ATOK 2010」に関するトピックス


最近、年のせいか集中力が衰えた感じがします。っと言っても昔からそんなに集中できるタイプじゃないですが。。そんな集中力が欠けたときに実によくなじむッ! 1日10円で“至高の”日本語入力環境を――まだまだ進化する「ATOK 2010」をみて久々に「おぉぉぉ」って感じました。

内容:

 筆者は以前、常用する日本語入力システムとして、MS-IMEから「ATOK 2008」へ乗り換えた理由を書いた。それから2年。今回は最新版のATOK 2010を取り上げ、ATOK 2008からバージョンアップをするべきなのか、OS標準のMS-IMEや無料のGoogle日本語入力ではなく、有料のATOKを使うべきかどうかについて考えていく。



【拡大画像や他の紹介画面】



 前述の記事を書いた時点では、日本語入力システムは「無料(OS標準付属)のMS-IME」 vs. 「有料のATOK」という図式がしばらく続くものだと思われていた。ところが、ここにきてGoogleからGoogle日本語入力、百度からBaidu Typeと、検索サイトが立て続けに無料の日本語入力システムを公開した。その結果、これまでの無料 vs.有料だけでなく、検索サイト vs. 研究所(ATOK Lab.)という見方もでき、ATOKはますます異色の存在となりつつある。



 その違いが如実に表れているのは、誤変換軽減のためのアプローチだ。膨大なサンプリングを元に統計的手法で頻出単語を網羅していく“検索サイト連合”に対し、ATOKは特に文節認識に注力しているという印象が強い。ATOKの変換エンジン「ATOKハイブリッドコア」はATOK 2007で初めて搭載されて以来、ATOK Lab.の日本語処理技術の研究成果を反映して進化を続けているが、その成果として、文節を正しく認識するための手法が占めるウエイトは大きい。



 続くATOK 2008は、統計的手法による文節区切りの評価が採用された。ATOK 2009では精度が向上し、文節区切りをより正確に特定できるようになったというやや漠然とした内容だったが、ATOK 2010では従来の出現単語の分野に応じた文脈処理のブラッシュアップに加え、同音異義語ごとの出現確率や前方単語との距離を考慮した組み合わせの確率を総合的に計算することで、同音語に対して適切に変換する新たな文脈処理を導入している。



 ATOKの変換方法には、通常利用される連文節変換のほか、自動的に変換を行う自動変換もある。その性質上、長文を一気に入力してから変換するという使い方になるが、便利な半面、誤変換時のペナルティが大きい。視線の動きが大きく、かつ、再変換の手間が発生するからだ。だが、ATOK 2010ではいよいよ自動変換が常用できる変換精度に達したという印象がある。つまり、たとえ視線の動きが大きくても「外れなければどうということはない」というわけだ。もちろん、「変換の結果を見る必要がない」というレベルに達していない以上は確認が必要だが、それでも予想外の誤変換がほとんどないため、ストレスはかなり少ない。



●英語の変換に対応



 このように「変換させっぱなし」を究極の状態とするのであれば、避けて通れないのが英語の入力サポートだろう。英語は本来、IMEの入力では対応外となっていたが、“国際化”の進む現在では、英語由来のカタカナ語や英単語そのものを文章中に使うことは一般的になっている。そのため、効率化を考えるのであれば、IMEを有効にしたまま英語を使うこと、さらに言えば英語処理にも日本語処理のようなインテリジェンスが求められることになる。



 ATOK 2009から搭載された英語入力支援機能「ATOK 4E」は、従来の「英字入力モード」を「英語入力モード」に進化させたもので、英数キーを押す、あるいはShiftキー+英字で半角アルファベット入力の推測候補モードに切り替わるというものだった。これを使えば「thank you」だけで「Thank you for your quick response.」を候補に出すなど、省入力が可能だ。特に、英語が不得手な場合は「あるべき文」が分からないこともある。そういったときに推測候補が例文集として役立つことも多いだろう。



 また、ATOK 2010から搭載された「英単語つづりからのカタカナ語変換」も重宝する機能だ。特にIT業界ではスクリプトやプログラムを書くときには英語、ドキュメントを書くときにはカタカナで書く単語もたくさんある。例えば、internet(インターネット)やnetwork(ネットワーク)、mail(メール)、server(サーバ)、process(プロセス)などなど、単語が簡単であるだけについつい英単語で書いてしまうことも多いのではないだろうか。



 一方、ATOK 2009からの機能だが、逆にローマ字単語を英単語に変換することもできる。これはまさしくかな漢字変換の英語版とも言える機能で、英語入力の際に分からない単語はローマ字でそのまま入力し、かなを漢字に変換するようにF4キーで英単語に変換すればいい。例えば、「I'll go to the konbini」と入力すれば「I'll go to the convenience store」と変換してくれる。



 さらに「ATOK 2010 for Windows [プレミアム]」には「8カ国語Web翻訳変換 for ATOK」機能が提供されている。英語だけでなく、中国語、韓国語、フランス語、ドイツ語、イタリア語、スペイン語、ポルトガル語の全8カ国語への変換をWebサービスを利用して行う。インターネット接続環境が必要になるものの、入力していくそばから翻訳文が表示されるのはかなり快適だ。



 このように見ていくと、ATOKの英語対応機能は大きく2つあることが分かる。1つは英語として入力された単語を日本語(カタカナ語)に変換するもの、そしてもう1つは日本語として入力された単語を英語に変換するものだ。つまり、日本語の中の英語、英語の中の日本語の両方をサポートしている。今後もシームレスな多言語入力環境としての発展が期待できそうだ。



●本当によくなじむ――チューニングで自分だけの入力環境を



 Windowsよりも長い歴史を持つATOKはさまざまな環境で使用され、多くのユーザーによって「手になじむ」使い方を模索され続けてきた。その結果、ATOKは広範にわたってカスタマイズができるようになっている。ここでは初期状態から変更することでより便利になるものをいくつかピックアップしていこう。



・句読点変換を有効にする



 句読点変換を有効にすると、句読点を入力した時点で自動的に未確定文字を変換する。句読点は文章中で比較的大きな意味の区切りでもあるため、自動変換を選択せず連文節変換+句読点変換でもほぼ同様の操作感が得られる。



・カーソル位置前後の文章を参照して変換する



 文章の推敲(すいこう)中など、すでに入力済みの文章に単語を付け足すことはままある。通常であればすでに確定済みの文字列は変換候補を確定するための情報として利用できないが、「カーソル位置前後の文章を参照して変換する」にチェックを入れておけば前後の文章から同音語の中から文脈にあった候補が優先的に表示されるようになる。



・テンキーからの入力を必ず半角にする/確定文字で入力する



 テンキーから入力された数字、記号を半角にする。そもそもテンキーは数字を大量入力する時に威力を発揮するもの。その際の数字は通常、半角を利用するはずだ。「テンキーからの入力を必ず半角にする」にチェックを入れておくとテンキーでは半角、フルキーでは全角、といった使い分けが可能になる。



 さらに「確定文字で入力する」にチェックを入れておくと、テンキー利用時にはあたかも日本語入力がオフになっているかのような振る舞いになる。特にExcelで重宝する機能だが、ほかのアプリケーションでも有効になっていて困ることはないだろう。



・ATOKプロパティ関連付けツール



 日本語入力システムは単体で使用されることはない。必ずほかのアプリケーションへの入力用メソッドとして使用される。そのため、どのような設定が最適かはアプリケーションにも依存する。前述の「テンキーからの入力を必ず半角にする」をExcelだけに対して使用したい場合などは複数のプロパティを作成し、それをATOKプロパティ関連付けツールでアプリケーションに関連付ければいい。



 ATOKは使い込めば使い込むほど手になじんでくる。そうなると、自分の利用するあらゆる環境でATOKを使用したい、今まで学習させた辞書を使いたい、と思うのも当然だろう。そんなニーズには「ATOK Sync」が用意されている。これは同社のインターネットストレージサービス「iDrive」と組み合わせて、複数のPCから同じ環境で利用できる同期ツールだ。なお、ATOKは利用者が一人である場合には1ライセンスで複数のPCにインストールすることが可能だ。



●ユーザーに開放されたATOKダイレクト



 ATOK 2010の新機能ではないが、入力支援の大きな可能性を秘めた機能として「ATOKダイレクト」についても触れておこう。ATOKダイレクトはATOK 2008から実装されている機能だ。入力された文字列を、単にかな漢字変換の変換前文字列として使うだけでなく、外部アプリケーションやWebへのアクセスのために利用できる、いわばATOKに拡張モジュールを組み込むための仕組みといえる。ジャストシステムからは「ATOKダイレクト for Yahoo! JAPAN」「ATOKダイレクト for はてな」の2つのプラグインが公開されており、その破壊力はよく知られるところだ。



 ATOK 2008のアップデートモジュールとして公開された「ATOKダイレクトAPI for Perl/Ruby」は、このATOKダイレクト用プラグインをPerl/Rubyスクリプトで作成するものだ。ATOK 2009からハッカー好みとも言われるPythonもサポートするようになり、「ATOKダイレクトAPI for Perl/Ruby/Python」と呼ばれるようになった。



 プラグインの作成方法は非常に簡単だ。Atok_pluginパッケージ(モジュール)にrun_process関数(Pythonの場合はatok_plugin_run_process関数)を作成し、入力された文字列を受け取り、候補を返すよう記述する。それだけだ。APIにはサンプルソースコードも含まれているので、それをスケルトンとして書き換えればいい。今回、サンプルとして百人一首の上の句を途中まで入力すれば候補として下の句を表示するプラグインを作成してみたが、プログラミングに要した時間はわずか15分ほどだった。実際、データ部分を除けば自分で書いた部分は10行にも満たない。



 作成したスクリプトを導入するには、設定ファイルとなるXMLファイルを作成し、別途配布されているセットアップツールを使ってプラグインを組み込む。こちらもAPIに含まれているファイルを書き換えればいい。



 このATOKダイレクトAPI for Perl/Ruby/Pythonは大いなる可能性を秘めている。かな漢字変換という枠組みを超え、「あらゆる入力をフックする仕組み」と考えるとどのアプリケーションでも発動可能なランチャー的な要素も見いだせる。つまり、候補として返す文字列は必ずしも変換候補である必要はない。



 また、ほかのアプリケーションのマクロなどと連動した使い方も考えられる。秀丸などの強力なマクロ機能を持つテキストエディタでもかな漢字変換中にアプローチすることは難しい。一方、ATOKダイレクトAPI for Perl/Ruby/Pythonはあくまでかな漢字変換中の文字しか受け取ることができない。この2つを組み合わせれば面白いことができそうだ。



●ATOK定額制サービスでも「ATOK 2010」に



 ATOKを語る際に、常に大きなポイントとなるのがその価格だ。ATOKのよさを知る古参ユーザーの多くは、“お布施”と称して毎年きちんとバージョンアップを行っているようだが、これまで無料のIMEを使用しており、今回初めてATOKを試すというユーザーにとっては、ダウンロード版でも「高いな」と感じるかもしれない。そんな人はまず、30日間利用できる無償試用版を試してほしい。その後、もうちょっと使ってみたいと感じたら、月々300円の「ATOK for Windows 月額版」を購入するといいだろう。1日10円程度で常に最新版のATOKが利用可能だ。



 そしていつしかATOKの日本語入力が手になじみ、「もう手放せない」と感じたら、今度は毎年バージョンアップしていくことを前提として、さらにお得な「ATOK 2010 スターターパック 1Year版」に移行するのも手だ。月額版では1年で3600円(無償試用版から利用した場合は3300円)であるのに対し、1Year版だと3360円になる。また、同時に使用しないという条件で、かつ利用者が一人に限られている場合は、10台までのPCにセットアップすることができる。パッケージ版に比べてPCインストール台数に制限が設けられているが、通常は10台も使用することはないだろう。



 Google日本語入力は、Googleの持つ膨大なサンプルを元に、統計的手法を用いて変換候補の精度向上を図っている。しかし、実際に使用して感じるのは、集合知に基づいた変換エンジンは結果的に精度よりも省入力にフォーカスされる傾向にあるということだ。事実、文脈として正しくなくても利用頻度の高い候補のほうが優先される。一方、ATOKも連想変換を搭載しているが、ベースとなっているのはやはり、精度の高い日本語変換能力で、“育ちのよい正しい日本語”を前提にしていながらさらに融通もきく、という印象を受ける。



 すでにかなり高いレベルにまで達していた変換精度をじわじわと上げつつ、カスタマイズ可能な設定を充実させることで、より多くの人のニーズにマッチした使用感を実現し、さらに日本語という枠にとどまらない入力支援ツールとして機能拡張を図るATOK。その円熟の技を体験するのに1日10円は破格と言っていいはずだ。【瓜生聖】




http://headlines.yahoo.co.jp/hl?a=20100310-00000078-zdn_pc-sci

Yahooニュースより


new2oo at 18:55 この記事をクリップ!
記事検索
テスト中
カテゴリ別アーカイブ
タグクラウド
ゲオECおすすめ商品

[PR]ゲーム買うならGEO
QRコード
QRコード
  • ライブドアブログ