打牌選択アルゴリズム(10) 〜 残り牌数の正規化 で残り牌数の数え方を変えたため、評価値の値も変わりました*1。 このため現在の評価値のスケールに合わせた押し引きの閾値にも変更が必要です。 押し引き表の牌姿は評価値何点? 〜 押し引きアルゴリズムの改善(3) と同様な方法で再調整していきます。
実際にAI同士を対戦させ、押し引きアルゴリズムの改善(1) で説明した「先制リーチを受けた後の局収支」を最小にするよう調整していきます。
閾値の調整に入る前に、同じ 押し引きアルゴリズムの改善(1) で行った
の修正を行いました。
この段階で局収支は以下となりました。
結果 | 0400 | 0600 | 修正後 |
---|---|---|---|
和了 | 10.2% | 10.2% | 11.6% |
放銃 | 10.3% | 10.6% | 12.8% |
被ツモ | 32.7% | 32.6% | 31.8% |
横移動 | 26.5% | 26.8% | 25.7% |
流局 | 20.3% | 20.0% | 18.1% |
局収支 | -1045 | -1082 | -1040 |
現在のAIの閾値は以下のとおりです*2。
意味 | 値 | |
---|---|---|
A | 1シャンテン以前でも全押しする(超好形) | 1200 |
B | 1シャンテンでもベタオリする(愚形) | 300 |
C | ポンテン・チーテンをとらない(副露愚形) | 500 |
D | テンパイしていても無スジは押さない(聴牌愚形) | 200 |
F | テンパイしてもリーチしない(立直愚形) | 200 |
実際にAI同士を1,000戦対戦させてこの値を再調整します。
押し引きを 0401 のアルゴリズムに戻したため、1シャンテンでは「スジまでは押す」となっていますが、これを評価値が 閾値A 以上なら全押しするように調整します。 超好形 なら1シャンテンでも全押しするということですね。
結果 | 調整前 |
---|---|
和了 | 11.6% |
放銃 | 12.8% |
被ツモ | 31.8% |
横移動 | 25.7% |
流局 | 18.1% |
局収支 | -1040 |
閾値Aの値は 1200 とします。