読者です 読者をやめる 読者になる 読者になる

Aestetica

コンピュータ将棋Selene(セレネ)を作っています。名前は西海枝昌彦(さいかいし まさひこ)と読みます。

電王トーナメントの補足

「マンメンミ」ではなく「マンメミ」と言っている(今さら)。


電王トーナメントの補足。

順位 プログラム名 探索 評価値
1 Ponanza Stockfish超強化版 3駒+手番+RootStrap
2 浮かむ瀬 Stockfish 3駒+手番+RootStrap
3 真やねうら王 Stockfish 3駒+手番+RootStrap
4 読み太 Stockfish 3駒+手番+RootStrap
5 大将軍 Stockfish 3駒+手番+RootStrap
6 Selene 独自探索 3駒、方策勾配法
7 たこっと Stockfish 3駒+手番+RootStrap
8 Qhapaq Stockfish 3駒+手番+RootStrap
9 白美神 Stockfish 3駒+手番+RootStrap
10 nozomi Stockfish 3駒+手番+RootStrap
11 習甦 Stockfish 習甦独自の例の難しいやつ
12 うさぴょん2’ Stockfish 3駒+手番+RootStrap

こう見ると、過去最高に作り方が統一されている感じが・・。
選手権もこうだったのかな?

ライブラリ使用者の場合、少しでも探索を強化できれば、他のライブラリは一網打尽!
読み太はそうだったのかな?どうだったのかな?お話を聞いたけど、なにかがうまくいったみたい。

Seleneとしては、どうにかStockfishを超えないことにはどうにもならない。
また、アレやコレやと試す日々となるのか・・。
最終的な探索部分がStockfishにどのくらい負けているのか気になるが、やねうら王なりにSeleneの評価値を組み込むのが面倒すぎるので気にしない方向で。

方策勾配法による学習は収束するのかどうか何回か聞かれましたが、収束するときは将棋の完全解明となります。
○×ゲームとか753ゲームとかだと速攻で収束します。10プレイとか、753だと100プレイとか。

習甦の例の評価値は難しすぎて相変わらずマネできないレベル。よくわかりません。
nozomiは時間の使い方が大変うまく、Ponanzaは若干使いすぎ?いや、今のコンピュータ将棋のレベルでは中盤で勝負は決まっているので、使いすぎと感じるくらいで良いのか。

また、浮かむ瀬ことAperyは、次回の命名権は私が落札して「合コン相手募集!切実です!」に絶対変えます。