読者です 読者をやめる 読者になる 読者になる

daruma3940の日記

理解や文章に間違い等あればどんなことでもご指摘お願いします

進行度の学習なのじぇ 3

f:id:daruma3940:20160520223745p:plain

昨日の晩から進行度の新しい実装のversionと進行度の昔の実装のversionを持ち時間0.1秒で自己対局させてたのが1500局試合が終わっていたので結果を見るのじぇ。

 

f:id:daruma3940:20160520223745p:plain

ちなみに昔の実装とは進行度をKKPだけを用いて計算しようとした、テスト局面でもきちんと終盤度を測れていなかったversionなのじぇ。

ちなみに王の周りの利きを調べるのをやめてるのじぇ。何故かと言うとKKPにはその辺りのことも考慮された値が格納されているだろうと思ったからなのじぇ。

f:id:daruma3940:20160520223745p:plain

結果がこれなのじぇ。

newprog vs old prog
588 24 891

1479局 588勝 891敗

勝率: 0.3975659229208925
標準誤差: 0.012731969696552983
0.95% 信頼区間 [0.37322515212981744, 0.42258282623394183]

相対イロレーティング: -72.20015118429453
標準誤差: 9.234666517194077
0.95% 信頼区間 [-90.05626256611926, -54.231141337971955]

 

f:id:daruma3940:20160521003616p:plain

ちょっと待って,,,進行度はちゃんと計算できている方が滅茶苦茶弱くなってるじゃない...進行度をちゃんと計算できていないほうが強いってどういうこと??

 

f:id:daruma3940:20160520223745p:plain

 進行度は正しく計算できてはいるものの、計算しているのはKPのような方法だからその計算の分深くまで読めなくなってしまっている可能性があるのじぇ。

もともとHistoryに格納される値は残り深さの2乗に比例する値で、補正する値は1乗の値なので全然補正の効果も出ていないし、そもそも何か補正を入れなくともhistoryの値は局面の変化に対応して、値が変わっていくのじぇ。

f:id:daruma3940:20160520223745p:plain

まあ言ってみれば補正なんてしないほうが強いソフトになるということだったのじぇ。

まあまりちゃがしたことは無意味だったのじぇ。

f:id:daruma3940:20160520223745p:plain

しかしPR文書にhistoryを進行度にあわせて補正しますって書いちゃったのでもうこれは独自性として変更不可能なのじぇ。だから今の静的評価値を進行度として用いようと思うのじぇ。これなら計算量も増えないし、正しく優制度を見積もれるはずなのじぇ。

 (P.S.このやり方でもELO-64下がってたのじぇ。何が悪いのかわからないのじぇ!!とりあえず元のバージョンに戻すのじぇ。独自性を立てれば強さが立たず、強さを立てれば独自性が立たないのじぇ....)

f:id:daruma3940:20160520223745p:plain

まあ微々速前進なのじぇ??