補足資料(4)(GTOであることの証明)
1.導入
前回の補足資料ではナッツオアエアーモデルのIP,OOPのアクションについて説明しました.今回は導出した戦略がGTO(均衡戦略)になっているかどうか調べたいと思います.ではまず前回導出した部分も含めて前提条件を確認しましょう
ナッツオアエアーモデル
以下に計算条件を示す.
IPのハンドレンジ:AA,QQ
OOPのハンドレンジ:KK
ボード:2s2h2d2c3s
POT:1
IP,OOPのエフェクティブスタック:1
ベットサイズ:1
IP,OOPの戦略
OOPは最初必ずチェックする.
IPはAAを必ずベットし,QQを1/2の確率でベットする.
OOPはKKを1/2の確率でコールする.
2.OOPの最初のアクションについて
IPの戦略はAAを必ずベット,QQを1/2の確率でベットなので,
OOPのチェックのEVは以下のようになります(補足資料(2)参照).
aの値は0以上なのでOOPのチェックの期待値は0.25以上あります.OOPのベットの期待値は0(補足資料(2)参照)なのでOOPはIPが先ほどの戦略を用いる限り必ずチェックすることがGTOです.
3.OOPがチェックした後のアクションについて
さて,OOPがチェックした後のIPとOOPのプレイがGTOであることを証明しましょう.
証明のやり方ですが,IPのプレイがOOPのプレイに対して最適プレイ(相手のプレイを最大限搾取するプレイ)であることと,OOPのプレイがIPのプレイに対して最適プレイであることを示せばいいです.
お互いの戦略が最適ならば他の戦略に切り替える理由はありませんよね?
まずはIPのプレイがOOPのプレイに対して最適プレイであることを確かめましょう.
IPがQQを1/2以下の割合でベットするとOOPがコールした場合のEVがどうなるか見てみましょう(補足資料(3)参照).(x=0.2で計算しました.)
となる.
つまりOOPはコールするとEVマイナスなのでエニハンフォールドしてIPのプレイを搾取できます.
次にIPがQQを1/2以上の割合でベットするとOOPがコールした場合のEVがどうなるか見てみましょう(補足資料(3)参照).(x=0.3で計算しました.)
つまりOOPはコールするとEVプラスなのでエニハンコールしてIPのプレイを搾取できます.
よって,IPがQQを1/2の確率でベットすることはOOPのプレイに対して最適プレイであることがわかりました.
次にOOPのプレイがIPのプレイに対して最適プレイであることを確かめましょう.
OOPがKKを1/2以上の割合でコールするとIPがQQでベットするEVがどうなるか見てみましょう(補足資料(3)参照).(y=0.6で計算しました.)
つまり,IPはQQでベットすることがEVマイナスなのでエニハンチェックしてOOPのプレイを搾取できます.
OOPがKKを1/2以下の割合でコールするとIPがQQでベットするEVがどうなるか見てみましょう(補足資料(3)参照).(y=0.3で計算しました.)
つまり,IPはQQでベットすることがEVプラスなのでエニハンベットしてOOPのプレイを搾取できます.
よって,OOPがKKを1/2の確率でコールすることはIPのプレイに対して最適プレイであることがわかりました.IPのプレイはOOPのプレイに対して最適プレイであり,OOPのプレイはIPのプレイに対して最適プレイであるのでIPとOOPのプレイはGTOであるといえます.
4.まとめ
ナッツオアエアーモデルにおいて,
IP:AAを常にベット,QQを2回に1回ベット
OOP:KKを2回に1回コール
という戦略は(OOPの最初のチェックを含めて)GTOであることを証明しました.
一つだけ断っておくと,一連の補足資料で説明したGTOの導出方法は数ある方法の一例ですし,今回導出したGTOは数あるGTOの一例にすぎません.
GTOの基礎の基礎を解説するだけでとても長くなってしまいましたがここまで読んでくださってありがとうございます.次こそGTOクイズの解説を書きたいと思います.
長文を読んでいただきありがとうございました.ご意見ご感想質問等あればコメントにてお願いします.
\end{document}