Home

押し引きアルゴリズムの改善(4) 〜 押し引き閾値の再調整

打牌選択アルゴリズム(10) 〜 残り牌数の正規化 で残り牌数の数え方を変えたため、評価値の値も変わりました*1。 このため現在の評価値のスケールに合わせた押し引きの閾値にも変更が必要です。 押し引き表の牌姿は評価値何点?押し引きアルゴリズムの改善(3) と同様な方法で再調整していきます。


前準備

実際にAI同士を対戦させ、押し引きアルゴリズムの改善(1) で説明した「先制リーチを受けた後の局収支」を最小にするよう調整していきます。

閾値の調整に入る前に、同じ 押し引きアルゴリズムの改善(1) で行った

の修正を行いました。

この段階で局収支は以下となりました。

結果 0400 0600 修正後
和了 10.2% 10.2% 11.6%
放銃 10.3% 10.6% 12.8%
被ツモ 32.7% 32.6% 31.8%
横移動 26.5% 26.8% 25.7%
流局 20.3% 20.0% 18.1%
局収支 -1045 -1082 -1040

閾値の調整

現在のAIの閾値は以下のとおりです*2

意味
A1シャンテン以前でも全押しする(超好形) 1200
B1シャンテンでもベタオリする(愚形) 300
Cポンテン・チーテンをとらない(副露愚形) 500
Dテンパイしていても無スジは押さない(聴牌愚形) 200
Fテンパイしてもリーチしない(立直愚形) 200

実際にAI同士を1,000戦対戦させてこの値を再調整します。

超好形の閾値(閾値A)

押し引きを 0401 のアルゴリズムに戻したため、1シャンテンでは「スジまでは押す」となっていますが、これを評価値が 閾値A 以上なら全押しするように調整します。 超好形 なら1シャンテンでも全押しするということですね。

結果 調整前
和了 11.6%
放銃 12.8%
被ツモ 31.8%
横移動 25.7%
流局 18.1%
局収支 -1040

閾値Aの値は 1200 とします。

  1. ^ ツモ可能枚数は見えていない牌数より少ないので、評価値も相対的に低くなる
  2. ^ ver.2.0.0 作成の際にも調整を行なっているため、ブログに掲載の値とは異なります。