先ごろスティーヴン・ホーキング博士が、人工知能は人類の終焉を意味すると発言して話題になった。AlphaGoを見ていると、あながちそれが夢物語、あるいは悪夢とも思えなくなってくる。

と、大きく出てみたけれども、そろそろネタ切れなので今日は雑談です。

まず、昨日の第三局について。結果的には前二局以上にイ・セドルの完敗だった。
これは、AlphaGoが強い以外に心理的要因も大きいと思う。事前はなんとか勝てそうだと思っていたのに、去年の10月とは全く別物のマンスターが目の前に現れている。しかも、負けたらもうシリーズの勝敗は決する。こういう状況で、イ・セドルに平常心で打てというのは酷というものだろう。
将棋でもそうだが、相手が強いと思ったらますます勝てなくなる悪循環に陥るのだ。
解説陣も慎重だった。それはそうだろう、悪いと思った手がそうではないという繰り返しを見せつけられたのだから。多分本音では相変わらずAlphaGoはプロの目には色々筋悪だったはずである。一日で碁が急に変わるわけがないので。
将棋でも強い人が指す手は批判されない。羽生善治が放った一手は、それが弱いプロが指したら酷評されるような筋悪に見える手でも、何か深い意味があるはずだと尊重されるのだ。信用というやつである。
セドルも解説陣も最初からAlphaGoに負けている感じだった。
それでも、セドルはなんとか突破口を見出そうと、敢えて乱暴な手を打つなど色々試していたようである。
特に、事前から注目されていたコウへの対応について、やや乱れたという意見もあった。但し、本コウにはきちんと対応したし、もともとAlphaGoが勝勢だったので特に問題なく、モンテカルロ法特有の勝ちになるとゆるむクセが出ただけという見方もある。
しかし、第四局以降では、セドルはそういうところをついていくかもしれない。こういうのを、将棋の世界では(別にそれに限らないかもしれないが)、「アンチコンピューター戦略」と呼ぶ。まさか、セドルがそんな事まで試さないといけない羽目になると誰が予想しただろうか。
解説の高尾が、「普通に打つと相当勝てないです」とまで言っていたのが実情を全て物語っていた。

将棋の世界でプロがソフトと戦う場合には、事前にソフトを貸出して研究することが可能なケースが多い。しかし、セドルは10月の棋譜を見ただけで、AlphaGoは勿論他のソフトとも全く対局しなかったらしい。それもセドルにはとても不利に働いたと思う。少なくともモンテカルロ法のソフトの傾向だけでもつかんでいれば多少は驚きや違和感を減らせたかもしれない。だが、どうもその程度の対策ではどうにもならないレベルに既に達してしまっているような気もするが。

最近知った記事にちょつと気になる事が書かれていた。
<囲碁>「アルファ碁、李世ドルに完勝する…グーグルの人工知能誇示」(2)
「私たちが見逃している部分がある。昨年10月、欧州囲碁チャンピオンの樊麾(Fan Hui)二段との対局のためにアルファ碁に入力されたのはプロ棋士の棋譜ではなかった。グーグル・ディープマインドは欧州アマチュアトップレベルの16万回の対局から約3000万件の碁盤状況を抽出した。その後、アルファ碁が棋譜を模倣した後、強化学習を通じて自ら最善の手を探すようにした。そしてアルファ碁は樊麾二段に圧勝した」
−−プロ棋士の棋譜を入力すれば棋力がさらに高まるということか。
「そうだ。昨年10月以降、アルファ碁は最高レベルのプロ棋士の棋譜を基礎に学習をしているはずだ。今も休まず、眠ることもなく対局しながら学習している」
なんと10月の対局では、アマチュアの棋譜を使って学習していたというのだ。それでも中国棋士には勝ってしまった。そして、セドルは10月の棋譜を見て、これなら勝てそうだと対戦を受諾した。しかし、その後プロの棋譜を使った「本気」の学習が始まったということである。これにはちょっと驚いた。

それと、解説を聞いていて気になったのだが、AlphaGoはモンテカルロプラスディープラーニングに加えて、石の生き死に専用のプログラムも備えているという噂があるそうだ。
それは私も気になっていて、AlphaGoは基本原理以外は謎につつまれている。特に、感覚で打つ碁なので、ちゃんと読まないで大石が死んだりしないものかと思っていたのだが、その辺も特別に対応しているのかもしれない。もっとも、そういうもの一切なしで大石が死なずに打てているのなら、ますます感覚がすごすぎるということになるのだが。
それと、囲碁の場合チェスや将棋と違うのは、手が進行するにつれて確実に盤面が埋まっていって、手の組み合わせがどんどん減っていく。だから、終局に近づけば近づくほどソフトが強くなるのは当たり前だ。その場合、ある程度の局面から、チェスや将棋のように具体的な指し手を探索する手法も有効だと思うが、しかし今のAlphaGoを見ているとそんな事をする必要もなさそうである。

囲碁は最後の砦で難攻不落だと言われ続けたが、一度ソフトが追いつくとむしろ人間が勝ちにくくなるゲームだと思う。というのは、将棋のようにとにかく相手玉を詰ませば勝ちならば、極端な話自玉の周りが焦土になってひどい駒損でも、一筋の相手玉への詰み筋を見つければ勝てる。しかし、囲碁は陣地取りゲームなのでそういう劇的な勝ち方は難しい。しかも、レベルがあがれば上がるほどその傾向は強まるだろう。だから、力の差があるとますます勝てなくなるような気がする。

将棋の渡辺明がブログで、「囲碁のほうが指し手が広い分、ソフトの手に対する違和感が大きいんでしょう。」と述べていた。
もともと、将棋ソフトはかなり定跡を入れているものが多いので、途中まではそれらしく指せる。
AlphaGoが定石にどう対応して、どの程度データを入れているのかは不明だが、囲碁の布石は本当に自由だと聞く。だから、将棋ほどデータベースに依存していないだろうし、多分布石のはやい段階から自力で打っていると推測される。
だから、第二局のような中央重視の人間には打てない構想も可能なのだろう。
逆に言うと、将棋のように序盤の制限が大きくないので、ソフトが新たな布石の可能性を提示する可能性もあるのだと思う。
もっとも、それはチェス将棋式の指し手を読む方式では無理で、ニューラルネットワークを使用したディープラーニングで人間の感覚に近いものがないと無理だろうが。

今日はAlphaGoのナローAIと汎用AIの問題や、昨日大雑把に紹介したAlphaGoの打つ手の「感覚」の問題についてももう少しきちんと考えてみたいと思ったのだが、またしても既に雑談が長くなりすぎた。
そして、冒頭のホーキングを受けてのオチまで実は準備していたのだが、それも明日に回すことにします。何か新聞小説の予告みたいですみません。