コンピュータ将棋は「機械学習」と「合議制」

 コンピュータVSプロ棋士情報処理学会と日本将棋連盟から発表されてから、その第1局というべき対戦が10月に迫っている。対局くらいならすぐにでもできそうなものだが、コンピュータ側は大学のグリッドを用意するとのことでスケジュールその他の都合があるのだろう。野次馬としては焦らされているようではある。

「プロ棋士並み」コンピュータ,女流王将に挑む「機械学習」と「合議制」組み合わせ(ITmedia)
【科学】将棋女流王将に挑むコンピューター 10月決戦 「機械学習」で棋力アップ
 合議制で大ポカ阻止めざす(MSN産経ニュース)

 コンピュータ将棋側の次の1手を決めるアルゴリズムとしては、GooglePageRankのように、巨大な行列の固有値問題を解くようなことになるのだろうか。PageRankでは検索結果のサイトの順位を決めるが、似たように有力候補手の順位が、最大固有値に属する固有ベクトルの値として求まるようなアルゴリズムが可能かもしれない。固有値問題を解くスピードとしてはもちろん高速のコンピュータが必要だが、それよりも問題なのはその係数行列である。


 形勢判断の評価関数のための係数は数百個くらい(それでも感覚的には相当多い)だったが、現在では50万個くらいになっているという。プロの棋譜から単純に評価関数を覚えこませようとする手法から、コンピュータだけの自律学習が可能になったためらしい。係数行列の値が学習によって滑らかに変化するようにするにはそれだけのパラメータが必要になるのだろう。将棋の形勢は1手で大きく変わる「離散的」な数値である。評価関数の値は「量子化」されているといってもよい。しかしその評価関数を構成する係数はなるべく「連続的」な数値で表されなければ正確とは言いがたいということであろう。


 またグリッドや合議制を用いる主な理由は「ミスを少なくする」ためということらしい。より建設的な発想としては、自律的な評価関数の合議制という手法が、さまざまな状況判断に対応するアルゴリズムへの応用、ミスの最小限に食い止める発想のプログラムに応用することなどが考えられそうである。特にミスを小さくして修正可能にする手法は現実社会の応用としては重要であろう。将棋の場合は「待ったなし」だからある意味、修正は不可能ではある。


 自分としては、あまりコンピュータVS人間というシチュエーションそのものにはそれほど興味はない。世間的にはその方が話題を呼びやすいかもしれないが、それはもう13年くらい前のチェスのカスパロフVSディープブルーの時代の発想で、将棋に焼き直しただけだからである。プロ棋士を神格化するあまり、コンピュータが勝つことが神の領域に踏み込むことのような考え方になる。人間の脳に近づくこととは発想が異なるわけだから、対決して競うことにはそれほど意味がないと思えるのである。


 将棋界はやたら今の時代に、コンピュータVS人間を煽りたいようだが、ちょっと違うように思える。かつて大山十五世名人は数十年前の何かのインタビューで、コンピュータが進歩した時代のコンピュータ将棋の可能性について聞かれたとき「そんなことになったら私らはおまんまの食い上げですよ」とあっさりと言っていた。直感的にいずれコンピュータが勝つに決まっていると見抜いていたように思える。


 また一方で将棋は「細かいミスをした方が負けるゲーム」であるとも言っていた。したがってきわめて人間的な対決になる。大山十五世名人はそれを悟っており、拮抗する局面でいかに相手のミスを誘うかの能力に長けていた人でもあった。しかしそれは将棋だけでなくプロスポーツそのものもみなそうである。先日のW杯もPKを外すミスをおかした日本が敗れてドラマになった。プロ野球でも投手の失投を捕えたホームランがドラマになる。それは技術だけでなく、人間同士の心理戦の側面があるからである。コンピュータには心理戦もミスを誘うこともなく、ひたすら細かいミスを無くするような手順ばかりであろう。コンピュータ同士でこのような手順ばかりで対決すれば究極の棋譜が出来上がるかもしれない。それは将棋というゲームを煮詰めることになるだろうが、その結果は何か。おそらく千日手持将棋(引き分け)という味気ないものになることだろう。


 ともあれ、世間と同じく野次馬的にこの対決を見守ることにしよう。しかしターゲットにされるプロ棋士も大変ではある。なにしろ心理戦も何も効かない相手である。