2017年10月19日

「黒魔術とディープラーニング―科学からの卒業」

<地球セミナ113-1  山本一成著「人工知能はどのようにして名人を超えたか」  第2章> <風鈴士>



<機械学習によってもたらされた「解釈性」と「性能」のトレードオフ>

   人工知能を飛躍的に進歩させてきた機械学習には様々な手法があり、中でも
ディープラーニングが今脚光を浴びている。しかし人工知能は性能が上がるほど
なぜ向上するかを論理的に説明することができなくなっている。IT研究者たちは
この現象を西洋の黒魔術と称し、情報科学、とりわけ人工知能の分野では「性能」
と「解釈性」のトレードオフが生じている。

<黒魔術化しているポナンザ>

    「ポナンザ」のプログラムがどうしてできているかの理由や理屈は開発者も理
解できていない。実行すると有効であると解るだけである。性能を上げる方法は、
改良ポナンザと以前からのポナンザを自動的に3000試合戦わせ勝率が52%
以上の場合、その改良を有効として取り入れている。作業は1日24時間自動で
行い、結果は統計処理している。成功しないことも日常茶飯事で、たまたまうまく
いった改良をかき集めているのが現状である。成功率は2%以下であるがひた
すら対局をさせて進化させる。したがって、強くなっていく感覚はプレイヤーとして
の実感はなく理詰めで説明はできない。
 

ポナンザは2013年以降トップ棋士に連勝中

   2013年 「第2回将棋電王戦」 佐藤慎一四段に勝利

2014年 「第3回将棋電王戦」 屋敷伸之九段に勝利

2015年 「将棋電王戦FINAL」村山慈明七段に勝利

2016年 「第1期電王戦」 山崎隆之八段に22

2017年 「第2期電王戦」 佐藤天彦名人に2戦2勝




      図ー1. 佐藤名人ポナンザに敗れる
     佐藤天彦とポナンザ

<黒魔術の一つ「怠惰な並列化」>

将棋・チェスのAI開発で有名な事象の一つとして「怠惰な並列化」がある。PC

はCPU(中央演算処理装置)の良し悪しが性能に直結し、最近までCPUがもの

すごいスピードで進化しており、18カ月で倍の性能になる経過をたどってきてい

る。将棋や囲碁などのソフトウェアはその流れに乗るだけで高速化が実現でき
た。将棋AIではCPの処理速度が決定的に重要で、2倍になれば同じソフト同士
でも
勝率は7〜8割向上する。

 

CPUの微細化には限界が生じ、最近は「マルチコア化」によって性能を上げる

ようになった、これを「並列処理」と呼んでいる。将棋プログラムでは「並列処理」

は思っているほどの性能を上げることができず、逆に並列化すると性能が劣るこ

とすらあった。この解決法として「怠惰な並列化」が見つかった、複数のコアに並

列処理をさせることによって、各コアは別々に作業するがたまたま発見できた良

い情報を全体で共有し結果的にスピードがあげることができた。しかし、適当に

良い情報を共有しあう方法がなぜうまくいくのか、その理由は専門家でも説明で

きない。

 

<ディープラーニングで人工知能が急速に発展する>

人工知能は機械学習により急速に進化を続けている、機械自らが知識を獲得

するようになったことによる。インターネット検索や顔認識機能なども機械学習に

よるもので、機械学習はIT企業、製造業において なくてはならないものになって

いる。機械学習の分野ではここ数年の間に大きなブレークスルーが何度もあり、

その中心は「深層学習:ディープラーニング」にあった。

 

ディープマインド社のアルファー碁は世界トップの囲碁棋士イ・セドルを破り人

間の最強を上回る性能を実現した。今後、人工知能はディープラーニングの潜

在能力の限界まで開発が継続され、潜在能力がどれぐらいあるかはよくわかっ

ていない。

 

将棋の人工知能「ポナンザ」はディープラーニングを使っていない、同じ機械学

習技術の一つロジスティック回帰手法を使っている。ロジスティック回帰手法は正

確性より早さや軽さに優れており1秒間に何百万局面も読む必要がある将棋に

向いている。一方のディープラーニングはあまり早くなく画面の判別に最適であ

る。

 

<ディープラーニングのしくみと歴史>

ディープラーニングの前身はニューラルネットワークといい「神経回路」を意味

する。ニューラルネットワークはCPが生まれたと同時期の70年前から考えられ

ていたもので、現代でも使われている。当初は多くの若い科学者たちはニューラ

ルネットワークに取り組んだが期待したような成果は出せず、10年前頃は散々

な扱いであった。層の数を深く重ねれば性能が向上することは予言されていたが、
実際には層を深くすると、学習が難しくなり期待するような成果は出せなかった

粘り強くニューラルネットワークに取り組んでいた研究者たちの中から、2000

ごろネットワークを深く重ねてもよい結果を出せることが発表されだした。しくみが

わかると驚異的なスピードで進展し、今では画像の認識では既存の手法をはる

かに上回る性能を出すようになっている。

<ディープラーニングを支える黒魔術、「ドロップアウト」>

誕生から10年が経ち、ディープラーニングは著しく複雑化したため、一定規模

のディープラーニングでは、なぜ今のパフォーマンスを発揮できるのかを明確に

説明できない。しかし、層がディープになってもちゃんと機能するよう様々な黒魔

術が生み出され、今ではこれらの技術は人工知能の進化に欠かすことができな

くなっている。

 

その一つに「ドロップアウト」という黒魔術がある。ディープラーニングは放って

おくと能力がありすぎ全てを丸暗記する「過学習」に陥ってしまう。「ドロップアウ

ト」はディープラーニングの「過学習」を防ぐ技術である。しかし、「過学習」は未知

の問題に対しては逆に正答率が落ちてしまう。参加するニューロンをところどころ

ランダムにドロップアウトさせるとそれを防ぐことができる、丸暗記ができない代

わりに必死になって入力の特徴をつかもうとする、それが繰り返され正答率が高

まってくる。ドロップアウト以外にもディープラーニングの機能を高める方法はたく

さんあるがその多くがおおむね「過学習」を防ぐことを目的にしている。

 

<今、ディープラーニングはどれくらいのことができるのか?>

現在ディープラーニングの活躍の場は広がっているが筆者でもその全貌を把

握はできていない、しかも日々新しい技術が生まれている。ディープラーニング

は「言葉」、「音声」、「画像」が大きな応用先である、何故なら人間にとってこの3

つの入力と出力が知能の発展に極めて重要なためである。

 

「言葉」

グーグルは以前より様々な言語間の翻訳を手掛けており2016年11月よりデ

ィープラーニングが使われるようになり飛躍的に能力を高めた。現在では口語で

ない文章は実用レベルに達しており人間の翻訳に限りなく近づいてきている。

 

「音声」

音声認識はディープラーニングの導入でスマートフォンへの入力はかなり一般

的になってきている。グーグルではディープラーニングを摂り入れて僅か1年で

音声認識の誤認率が23%から8%に下げた(2015年5月)。その後マイクロソ

フトでは誤認率を5.9%にできた(2016年11月)。現在では日本でもPCやス

マートフォンで音声入力が一般的になりつつある。

 

「画像」

ディープラーニングにおいて画像認識が花形で、映っている物が何であるかは

もちろんその種類をも特定することができ、人間より正確な判定も可能になった。

画像を判定するだけでなく画像の出力もできるため、白黒画像を入力し自動的に

着色した画像を出力することができるようになった。

「マルチモーダル」

      図ー2. マルチモーダルが可能になるディープラーニング
         マルチモーダル

ディープラーニングを発展させると「入力→出力」の経路を「画像」「文字」「音

声」から、それぞれ自由に選ぶことができ、しかもそれが正確であるため、多くの

人はそれを知能と認めなくてはならなくなってきている。

 

<ディープラーニングと知能の本質は「画像」なのか?>

ディープラーニングのマルチモーダル化の最新の例として「言語の処理も画像

として行う」手法が登場し意外とうまくいく事が分かってきた。言語であれ何であ

れ、何とか画像に結び付けることができれば、一気にディープラーニングの得意

な対象となり、人間の知能を超えることができると考えられる。画像は非常に多く

の情報を表現することができるため、どんなものでも画像にすることさえできれば

距離的なものだけでなく時間的な面も表わすことができる。私たちの脳は3次元

の実像を2次元の画像にして記録しており、1次元の数字の列をわざわざ2次元

のグラフ(画像)にして解釈している。人間の目は脳の付属物ではなく、眼があっ

たから脳が進化したとも考えられる。これは人間の眼球と脳の密接なつながりは

「画像が知能の本質」であることの証拠なのかもせれない。

<還元主義的な科学からの卒業>

科学は還元主義でできている、それは「物を分解し、細部の構造を理解して

いけば、全体を理解できる」という考え方である。知能を理解するにはこの還元

主義的な考え方を当てはめることはできない。10年間かけて作ってきたポナンザ

がなぜ強いのか、作者である私でも説明ができない。どれだけ詳細にプログラム

を調べてもポナンザの知能を理解することができない。ディープラーニングも同

様に還元主義の考えでは理解することができない、様々なテクニックが駆使され

それらがほとんど黒魔術化され、その仕組みを説明することができない。

 

ディープラーニングは結果を出すのに職人芸的なノウハウが必要で、科学の

粋を尽くしたコンピューターにも拘わらず職人芸が必要なのは不思議なことであ

る。最近のAIの開発現場では以前の数理的な説明は少なくなり、「ディープラー

ニングの気持ち」についての説明が増えてきた。複雑すぎて数理が見えないもの

に対して、人間は「気持ち」で推し量るしかなくなっている。筆者も将棋のプログラ

ムを検討するとき数理式を考えるより「ポナンザの気持ち」になって取り組むこと

が多くなってきた。

 

他の科学者達からも「人工知能は科学ではない」と指摘され、還元主義的な科

学の思想とは相いれないといわれている。知能の仕組みや原理は論理的に説

明できるものではなく、研究者たちはそれを実感しながら人工知能の開発に携わ

っている。

 

(感想)

チェス、将棋、囲碁は人類の歴史の中で高度な教養・娯楽の一部として親

しまれ、長いあいだ伝統が保たれてきている。いつの時代にも名人や達人が輩出

され、その技は神業と誰からも尊敬されてきた。

 

この本ではチェス、将棋、囲碁の世界で人工知能がことごとく名人・達人の実

力を超えたことと、さらに今後も進化し続けることを指摘している。将棋や囲碁以

外の分野においても人間の能力を超えるであろうと予測している。

 

この人工知能の無限とも思われる能力を生かし、世界の貧困、戦争、気候変

動、医療などの難問解決に早急に取り組むべきではないだろうか。


参考文献

「グーグルに学ぶディープラーニング」 日経ビッグデータ編集 日経BP

AIまるわかり」古明地正俊・長谷佳明著 日経文庫

「人工知能の核心」 羽生善治・NHKスペシャル取材班 NHK出版新書

「決断力」 羽生善治  角川書店

「棋士とAIはどう戦ってきたか」 松本博文  洋泉社


      




belldeer66 at 18:30│Comments(0)観察と学習 

コメントする

名前
URL
 
  絵文字