■ - daruma3940の日記

f:id:daruma3940:20160520223745p:plain

ううっ...!中規模棋譜学習に手を出してみたけれどなかなかうまくいかないじぇ...

深い探索の評価値と浅い探索の評価値の差の2乗は学習でどんどん小さくなっているので実装は間違っていないはずだし、差し手生成祭りの局面でもすぐにこの局面が悪いということに気が付いているのだけれど...

f:id:daruma3940:20160521003616p:plain

中規模棋譜学習ってあれでしょ？

自分の深い探索の結果を教師として学習を行うやつでしょ？

Squirrel君の強さじゃちゃんとした教師を作れてないんじゃないの？

f:id:daruma3940:20160520223745p:plain

う～～ん一応bonanza6よりちょっと弱い位の強さになってきたので頃合いじゃないかと思ったのだけれど...

f:id:daruma3940:20170418200035j:plain

f:id:daruma3940:20160709192554j:plain

ありしゅが言ったこと以外にも初期局面データ集が悪かったとか教師データをちゃんと作れてなかったとかハフマン符号化、復号化に失敗してたとか探索時に置換表を使ってなかったこととか、いろいろ考えられるねっ...

f:id:daruma3940:20160520223745p:plain

あと初期局面データを作るときに気づいたけど探索深さ８では評価値の絶対値が100以下だったのに、探索深さが9になると1000近くになったり評価値が不安定だったことも原因に考えられそうなのじぇ...

技巧や習甦みたいにボナメゾに浅い探索結果と深い探索結果との誤差の損失項を入れたほうがよかったのかもしれないのじぇ..

f:id:daruma3940:20160520223745p:plain

まあ一旦別のところに手を付けようじぇ。