情報処理学会が将棋連盟に挑戦状

 コンピュータにも将棋にもある程度通じている者にとっては、これは語っても語り尽くせない話題ではある。コンピュータ将棋のソフト側が人間のプロに挑戦状を叩きつけたという、脚色満点の話題作りのようではある。

情報処理学会が将棋連盟に挑戦状 米長会長、「いい度胸」と受けて立つ(ITmedia)
挑戦状に関するFAQ(情報処理学会)

 将棋のプロであると同時に興行団体でもある将棋連盟側が「人間VSコンピュータ」をアピールするために、わざわざ挑戦状という形を取ったのか舞台裏はわからないが、挑戦する側が「情報処理学会」というのはやや違和感もある。学会は興行には無縁なイメージがあるからである。どうせ興行をやりたいなら、コンピュータ側はアンドロイドに将棋を指させるようにしたらどうだろうか。


 「人間VSコンピュータ」ですぐに連想されるのは、チェスの世界チャンピオンだったカスパロフIBMのディープブルーとの戦いである。その将棋版を狙ったということだろう。もっともカスパロフVSディープブルーの頃は、将棋のソフトはまだ到底人間と競うレベルではなかった。原理的には将棋の方がチェスよりも複雑だからである。時代が進んで、将棋でのチェスのように人間の名人に伍するだけの実力レベルに到達したことを実証したいということなのだろう。ディープブルーはIBMのスーパーコンピュータだったが、将棋の方ではグリッドになるというのも時代の流れを感じさせる.


 ただ、あまりに勝ち負けのみにこだわりすぎているようにも見えなくもない。ディープブルーの場合、というより人工知能の場合「チェスができるコンピュータ」、あるいは「人間が行っているいるのか、コンピュータが行っているのか区別がつかない」というのが、その進歩の象徴でもあった。であるから、ディープブルーはチェスの世界チャンピオンと事実上遜色がない実力があると実証された時点で、その役割を終えたわけである。その開発に至った成果の副産物が、他の分野の開発に生かされればよいということだった。


 将棋の場合はどうなるか。むしろ見世物興行にしたいようである。ひょっとすれば今後10年くらいかけて、コンピュータが勝ち抜いて名人との対戦に到達するまで引っ張りたいのかもしれない。ただどう見ても、チェスのようにいずれコンピュータが人間を凌駕することは目に見えていることだろう。勝った負けたより、コンピュータ側にとっては、それによってどんな副産物的成果が挙げられたかの方が重要になるだろう。


 さて強くなったとはいえ、コンピュータで将棋の最善の手を探索するのは何が難しいのか、適当に想像してみる。まず先読みしようとすればするほど場合の数が増えて、いかにコンピュータでも読み切れない。たった9×9の将棋盤と思っても、これは場合の数が爆発する「巡回セールスマン問題」(NP完全問題)と似た状況の困難な問題である。正しくは探索木が膨大になるということである。だから何らかのヒューリスティックな手法で探索するしかないのは人工知能の常ではある。そして運良く膨大な場合の数を探索できたにしろ、最適値を決定するための基準が問題である。いわゆる評価関数というものである。人間のプロはこれを「大局観」という。コンピュータは何らか数値化しなければならないから、その計算式が近似的でも表されなければならない。原理的にはこれが先見的(a priori)に与えられなければならない。やや意味は違うが、良い手から悪い手までの順位付けは、GooglePageRankのようなものである。


 近似的にしろ何らかの評価関数が定まったとすると、関数の形を調整するための複数の係数がかかることになるだろう。そして経験値(棋譜データなど)を入れながら、この係数をチューニングしていくことになる。これはニューラルネットの学習係数のようなものである。うまくいけば人間のように対戦を重ねれば係数が最適化されていき、平均的に強くて負けにくいソフトになっていくことだろう。しかしそれでも大敗することもあると予想される。それは将棋の手の価値が「離散的」だからである。係数がほんのわずかに違う(0.01とか0.001とか)だけで、その後の手順はガラリと変わり、形勢(評価関数値)の開きもどんどん大きくなってしまうこともありうる。これは評価関数で表される手順の経路がカオス的状態であるということである。したがって「必勝手順」なる唯一の手順が簡単に決まるような単純な話ではないということである。


 そうした困難がコンピュータには常に伴なうが、だからといってコンピュータが人間より強くはなれないということではない。場合の数が有限な詰将棋のような場合には、オセロの終盤と同じですべて読み切りで勝ちを一瞬のうちに判定できるから、うっかりの逆転負けはありえないことになる。コンピュータと人間が暗算で正確さを競うようなもので、ほとんど意味のないことになるだろう。人間はもともとアナログ思考で脳もカオス的だから、カオス状態にある手順もむしろ判断しやすいようになっているかもしれない。最善手ではなくても場面場面で大きくは崩れない手順を感覚的に発見しているのかもしれない。しかしこれは人間でもトップレベルの強さを持つ人だけだろう。


 いずれまた、この話題については議論することもあるだろう。