読者です 読者をやめる 読者になる 読者になる

daruma3940の日記

理解や文章に間違い等あればどんなことでもご指摘お願いします

ProbCutがわからないのじぇ!!!

f:id:daruma3940:20160520223745p:plain

前回の続きなのじぇ。
Probcutについてなのじぇ2 - daruma3940の日記

ProbCutの理論についてcomputerchessのwikiを見ながら理解を進めていっていたところなのじぇ。

f:id:daruma3940:20160520223745p:plain

前回の記事で
(a*v'+b-β)/σ>-e/σ

までは理解できているので、ここからもう一度見なおそうじぇ。

-e/σは中央値が0である正規分布(累積分布関数はΦとする。)に従い、
条件は確率のp以上となる確率と同値である。

f:id:daruma3940:20160520223745p:plain

ここがこの議論のネックなのじぇ。
f:id:daruma3940:20160520223745p:plain

まずは正規分布について見ていこうじぇ。
f:id:daruma3940:20160824201529p:plain

これが正規分布のグラフなのじぇ。
横軸が取りうる値、縦軸がその値を取る確率という意味だったはずなのじぇ。(汗)
ここでは中央値が0であるので-e/σが取りうる確率が高いのは0なのじぇ。
f:id:daruma3940:20160520223745p:plain

ここで累積分布関数はこんな関数なのじぇ。
f:id:daruma3940:20160824201842p:plain

これは横軸が取りうる値、縦軸が正規分布の縦軸の値をー∞からその横軸の値まで足し算していった値なのじぇ。
まあ[-∞,x]の正規分布関数の積分といってもいいのじぇ。
f:id:daruma3940:20160520223745p:plain

  • e/σの値は確率によっていろんな値が許されるけれどもまあ殆ど出てこない値というのもあるのじぇ。

ここで累積分布関数より正規分布の全範囲での積分の値は1であるのじぇ。
積分布関数が0.99となる値を探してその時のxの値を境界として、もしそれ以上のxの値が出た場合は確率的にほとんど出てこないような値が出てきてしまったとみなそうじぇ。
(こういうのはσを用いて3σなどとするのが一般的出るような気がするがどうして累積分布関数を使う??)

つまり
(a*v'+b-β)/σ>-e/σ
の例で行くと
a*v'+b>β
が-e/σという確率的誤差によって許される範囲以上に置いて成り立っているとみなすのじぇ。
つまりこれはbeta-cutできるということなのじぇ!!
xをもし累積分布関数が0.99となる時の横軸の値だとすると
Φ(x)=0.99であるので、
x=Φ^-1(0.99)
なのじぇ。

それによってこれは
(a*v'+b-β)/σ>Φ^-1(0.99)
となり、式を変形すると
v'>{Φ^-1(0.99)*σ+β-b}/a
であり

また
積分布関数が0.99となる横軸の値でなくても0.95や累積分布関数が任意の値となる横軸の値を用いて構わないので
この0.99をpとして

v'>{Φ^-1(p)*σ+β-b}/a
とする。
f:id:daruma3940:20160520223745p:plain
ProbCutはこういうことではないかとまりちゃは考えるのじぇ。

f:id:daruma3940:20160520223745p:plain
理解が浅いので間違ってたら指摘して欲しいのじぇ。