第二局の記事を書いた際に、AlphaGoが従来の人間の常識ではありえないような中央重視の厚い碁を打って、しかも勝ってしまったことを指摘した。その後、韓国のプロがその事を認めている記事を教えていただいた。
なぜAlphaGoにそういうことが可能なのか、その仕組みについて諸記事を参照しながら考えてみたい。

1. チェスの歴史

チェスでカスパロフがディープブルーに負けたのが、この種の歴史の発端である。
その際に、ディープブルーは、チェスの指し手の組み合わせをしらみつぶしに読む「全幅検索」と呼ばれる手法を採用していた。
そして、ディープブルーの巨大なマシーンで、いわば「力ずく」で様々な指し手を読んで、カスパロフを負かしてしまったのである。

2. 将棋の歴史

将棋はチェスより盤面が広くコマも多い。さらに取った駒を再利用できるので、指しての可能性が多くチェスよりも攻略が難しかった。
従って、全部をしらみつぶしに読む「全幅検索」ではなく、有効な手を深く読む「選択検索」という手法などを用いて強くなっていく。同時に、いくら読んでも局面を正しく評価できないと意味がないが、その「評価関数」を初期は人間が手動設定していた。
それを、Bonanzaを開発した保木邦仁が、プロの膨大な棋譜をコンピューターに学習させる「機械学習」によって飛躍的に局面の評価が正確にできるようになった。
保木Bonanzaは、パソコン一台で参加した世界コンピューター選手権で優勝する。
それがブレークスルーとなって、以降様々な改良が加えられてさらに飛躍的に強くなり、Ponanzaなど多くの強豪ソフトが現れ、現在はトッププロと少なくとも同等、あるいは既に越えてしまったと言われている。
ただ、将棋もチェス同様に、手の組み合わせを具体的になるべく多く読むのが基本的な手法である事には変わりがない。

3.囲碁のモンテカルロ木探索

囲碁は将棋よりもさらに盤面が広くて、手の組み合わせが多すぎるので、チェスや将棋のように手を具体的に読む手法では対応できないでいた。
そこに現れたのがモンテカルロ木探索である。具体的に手を読むのではなく、ある局面から適当に終局まで打つ作業を重ねて、その中から勝つ確率の高い手を採用するという手法である。
そんな方法で強くなれるのか直感的には不思議なのだが、今述べた原始的なモンテカルロに選択的に勝つ確率の高い手を多く並べるという手法などを採用し、その他にも様々な技術的改良を加えてかなり強くなった。
それでも、日本の囲碁プロ棋士に石を何目か置いて勝てるレベルで、プロに肩を並べるのは大変だと言われていた。
AlphaGoもこの手法を用いていて、そこにディープラーニングを加えたのである。

モンテカルロ木探索およびコンピューター囲碁の進歩について

さて、ようやくここからがAlphaGoの話である。

4.ニューラルネットワークによる深層学習(ディープラーニング)とは

AlphaGoが中国プロに勝ったニュースを聞いて、この事を調べだしたのだが、完全文系の私には「初歩的な」解説記事も難しかった。しかし、以下の記事は分かりやすい。

深層学習(ディープラーニング)を素人向けに解説(前編)―基礎となるニューラルネットワークについて
深層学習(ディープラーニング)を素人向けに解説(後編)―特徴選びの重要性、機械はどうやって物事を理解するのか?
人の神経を模したネットワーク構造である「ニューラルネットワーク」を用いて、コンピューターがなるべく自力で学んで判断するという事である。
初歩的な例としては、図像を見てそれがなんという動物なのかを自分で学んで判断するなど。

5.ディープラーニングの特徴

囲碁でAIに負ける人類 生き残りの道は

この記事で、囲碁に具体的に関連させてディープラーニングの特徴が分かりやすく説明されている。
 しかし、もしディープラーニングで囲碁に関して十分な棋力が得られるとすると、知性とは本質的には論理性とは無関係であることが想像できます。
 なぜならディープラーニングそのものは一切の論理性を獲得しないからです。
 ディープニューラルネットワークが学習によって獲得するのは、あくまでも特徴量です。
 特徴量というのは、要するに囲碁なら盤面を見て「どの盤面をどのように感じ取ればいいか」という感覚です。
(中略)やはりここには一切の論理性や確たる根拠はなく、「なんとなくこうすると良さそうな気がするから」そこに石を打つ、ということになります。
ディープラーニングは、人間がしている手を論理的に具体的に読んで判断する方法とは全く異なって、感覚的直感的に判断するという事である。これが、チェスや将棋のソフトの方法とは一番異なるところだと思う。
しかし、人間のプロの囲碁の「感覚」というのは、言うまでもなく大変洗練された高度なものなので、果たしてこういうディープラーニングで正しい感覚が獲得できるのか、素朴には疑問に思ってしまうところだろう。
チェスや将棋でコンピューターがたくさん読むことで人間を凌駕するのは簡単に理解できる。しかし、このようなやり方で本当に人間の感覚に並べるのかと思ってしまうのだ。

6.AlphaGoのディープラーニング

「囲碁の謎」を解いたグーグルの超知能は、人工知能の進化を10年早めた
「棋士たちは、無意識的にパターンの照合を行っています」とハサビスは説明する。「ディープラーニングはそれをとてもうまくやるのです」
つまり、チェスや将棋のソフトのように多くの手を具体的に読んでその中から優劣を決めるのではなく、まるで人間の囲碁棋士が盤面を見て直感で手を選ぶように、それまでの経験を無意識に照合して感覚的に手を選ぶというのである。
ハサビスは簡単に言ってのけているが、コンピューターにこのような事が可能なのは本当に驚きである。
チェスや将棋でコンピューターが物量的にたくさん読むのはこれは仕方ない。しかし、感覚の部分でも人間のような事ができるというのだから。
しかし、イ・セドルとの対局をみるとそれが出来ているのはほぼ間違いない。

7.AlphaGoの自己学習

もう一点、重要なのはAlhaGoが、自力で強くなり自分の戦略を見出しているらしいと言うことである。
「AlphaGoは自分と同じニューラルネットワークと何百万回もの試合をすることで、自らが使う戦略を発見することを学びました。そしてだんだんと上達しています」。ディープマインドの研究者デビッド・シルヴァーはこう話す。
同上記事より
まず、最初にプロの囲碁棋士の膨大な棋譜をAlphaGoに学ばせて、57パーセントの確率で人間の次の手を予測することを可能にした。
それだけでも大した成果だが、それならばあくまで人間のプロ棋士の枠内におさまる話である。
しかし、AlphaGoは自分と少しだけ違う自身と膨大な対局を重ねることで、ミスを減らすだけでなく、自分で新たな戦略も見つけているというのだ。
当初これを読んだ際に、私はさすがにこれには懐疑的だった。あくまでプロ棋士の棋譜がベースなのだから、多少は違っても人間にはない戦略を自力で見出すのはさすがに無理なのではないかと。
しかし、第二局を見てもしかするとこれも本当なのかもしれないと考え始めているのである。

なお、AlphaGoは、二種類のディープラーニングのニューラルネットワークを用いるなど、物理的にも大変なハードを用いている。とても個人では無理でグーグルだから出来ることだ。
ただ、そういう膨大なハードを用いながら目指しているのは、人間の感覚に近いあるいは新たな感覚の着手を可能にすることである。言うまでもないが、膨大なハードを使うだけでは囲碁の攻略など不可能である。

8.AlphaGoの中央志向の厚みの独創的な碁
<囲碁:人間vs人工知能>神秘の領域、中央の「厚み」・・・アルファ碁は計算した
アルファ碁が5000年間続いてきた囲碁の原理を根本から書き換えつつある。核心は中央攻略だ。かつて人間が「厚み」と命名して神秘の領域として残してきた空間を、アルファ碁はついに精密な計算力で征服し遂げている。
最後に以上を踏まえたうえでイ・セドルとの対局について少し具体的に考察してみる。
第二局もプロにとっては違和感の大きい手が多かったようだ。そして、あまりにも中央に手厚すぎて普通なら簡単に破綻してしまいそうな碁だった。
ところが、局後にプロがよく検討してみると、そういう打ち方でもちゃんとバランスが保たれていたというのだ。
人間には計算しきれない中央の厚みをまるでAlpha碁は計算できていたかのようだという述べ方がされている。
しかし、今日の記事を最初からつきあってくださった方はお分かりだろうが、AlphaGoは厳密には計算していない。そうではなくて、経験から直感的に正しいという手を感覚的に選択しているのだ。
つまり、こうは言えないだろうか。人間の場合、中央に厚く打ちたくても地の確保が心配で打てない。しかし、AlphaGoは、自身の感覚を信じきって恐れず中央に手厚く打つ勇気がある。そして、それは計算ではない。
だから、AlphaGoは人間の感覚を極限まで研ぎ澄ました形で発揮して、人間の先入観や恐れを克服してくれる存在なのかもしれない。
AlphaGoは、その強さでは人間にとってモンスターだけれども、その囲碁の内容は人間に素晴らしい示唆を与えてくれる天使なのかもしれない。

関連記事
イ・セドルとAlpha Goの五番勝負第一局雑感
イ・セドルに連勝したAlphaGoについて
アルファ碁に勝った人間、イ・セドルと人工知能の未来