読者です 読者をやめる 読者になる 読者になる

daruma3940の日記

理解や文章に間違い等あればどんなことでもご指摘お願いします

bonanzaのpenalty項わかんねーのじぇ

コンピューター将棋

f:id:daruma3940:20160520223745p:plain

bonanzaのpenalty項わかんねーのじぇ。

なんなのじぇ

#define FV_PENALTY             ( 0.2 / 32 )

って(;^_^A

 

駒割りパラメータの合計-6500で束縛をするとか、特徴ベクトルの大きさでペナルティをかけるとか進歩本に書いてるけど、特徴ベクトルの大きさの和はprintf()にしか使ってないし実際に使われてるのは ( 0.2 / 32 )だし、この値もどこから出てきた値なのかわからないし...

 

 

 

f:id:daruma3940:20160520223745p:plain

ところで

学習に使う評価値はPVを作成するための探索をしたときの評価値を使っていたけど、PVで末端局面まで移動させてそこでの静的評価値を使ったほうがいいのかもしれないし、あとAperyチームの杉田さんがBonanzaは1iterationで学習用の全棋譜使ってたって言ってたので今やってる1iteration1000棋譜じゃ足りないのかもしれないのじぇ....