Aestetica

コンピュータ将棋Selene(セレネ)を作っています。名前は西海枝昌彦(さいかいし まさひこ)と読みます。

電王トーナメントにエントリーしました。

魁男塾が読めなくなっていることを知って、ようやく大人になったことを悟りました。
自分はお兄さんだと思ってたよ。


電王トーナメントにエントリーしました。
学習部分は、正直言ってまー、なにも新しいこともなく、ただひたすら去年半ばから行っている方策勾配法という学習方法を繰り返してるだけ。ただ、試行回数(サンプル数)は、まわりのみんなの何億というオーダーを聞いてびっくりし、従来の100~2000回くらいだったのを大幅に増やして試しています。

探索部分については、去年版Seleneからやねうら王の評価関数を読めるようにして、いやしかし差分計算は大変厳しかったので移植せず、両者差分計算しない状態で試したところ、勝率は30%とかで、非常に短い時間だとさらに20%代とかになるので、広く使用されているstockfish型と比べるとぜんぜんダメじゃん!と、ひどく落胆しました。
そりゃまあ、読みの深さに何手も差がつくよなあ・・。

そこから、選択アルゴリズムの幅を広げて再度なんとかしようといった状況です。
いくつか、小さい実験を行って、基礎的なデータを一通り集めた感じなので、なんとかやってみよう。

よく、ディープラーニングブラックボックスで、仕組み不明&やってみないとわからんとかなんとか言うけれど、探索も含めて、ビッグデータを扱うようなアルゴリズムは全般的によくわからんというか、探索の場合だとさらに含まれているアルゴリズムの量が多いので、さらによくわかりません。

評価関数がわからん。と、探索がわからん。は、同じわからんでもニュアンスが違っていて、評価関数は迷路的で探索は闇鍋の感じがするけどどうだろうか。どうだろうか。という問いかけがどうだろうか。