<?xml version="1.0" encoding="utf-8" ?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
<title>bp-chokokuのブログ</title>
<link>https://ameblo.jp/bp-chokoku/</link>
<atom:link href="https://rssblog.ameba.jp/bp-chokoku/rss20.xml" rel="self" type="application/rss+xml" />
<atom:link rel="hub" href="http://pubsubhubbub.appspot.com" />
<description>ブログの説明を入力します。</description>
<language>ja</language>
<item>
<title>レートの下振れ、上振れについて</title>
<description>
<![CDATA[ <p>過去に、旧レーティングシステムの対戦データをもとに、下振れや上振れについてシミュレーションを行ったことがあります。</p><p>システム変更後ではまだ行ってなかったので改めて実施しました。</p><p>&nbsp;</p><p>イメージとしては、仮に実力レートが1760相当の同じ実力を持ったプレイヤーが30人いたとして、ある時期における彼らの実力レートは、どれくらいの幅で分布するかというものです。</p><p>&nbsp;</p><p>それを調べるために、自分が2019年7月27日から2019年8月25日にかけて対戦して得られたデータ（<span style="font-weight:bold;">1857試合分、平均レート1794、実力レート1764</span>）をもとに、シミュレーションを行います。</p><p>&nbsp;</p><p><a href="https://stat.ameba.jp/user_images/20190911/00/bp-chokoku/aa/c6/j/o0805035214583858495.jpg"><img alt="" height="184" src="https://stat.ameba.jp/user_images/20190911/00/bp-chokoku/aa/c6/j/o0805035214583858495.jpg" width="420"></a></p><p>　　　　　　　　　　　　　　　　実際の対戦記録</p><p>&nbsp;</p><p>方法については、主に1857試合分のレート変動値（相手レートとの差によるハンディを含めたレートの変動値）を使用します。これの順序をランダムに組み替えて、その都度平均レート1794に対しての補正をかけることによって、あたかも<span style="font-weight:bold;">同じ環境、同じ実力者が追加で1857試合分を行った仮想のデータ</span>を作ります。</p><p>&nbsp;</p><p>その追加の1857試合を1セットとし、それを<span style="font-weight:bold;">30セット分</span>行うことによって、<span style="font-weight:bold;">実際の対戦成績と同じ実力を持った30人分の対戦結果</span>を出しました。30セット分の結果をグラフで載せます。</p><p>&nbsp;</p><p><a href="https://stat.ameba.jp/user_images/20190911/00/bp-chokoku/ae/be/j/o1281088814583858454.jpg"><img alt="" height="291" src="https://stat.ameba.jp/user_images/20190911/00/bp-chokoku/ae/be/j/o1281088814583858454.jpg" width="420"></a></p><p><a href="https://stat.ameba.jp/user_images/20190911/00/bp-chokoku/6e/bc/j/o1281088814583858421.jpg"><img alt="" height="291" src="https://stat.ameba.jp/user_images/20190911/00/bp-chokoku/6e/bc/j/o1281088814583858421.jpg" width="420"></a></p><p><a href="https://stat.ameba.jp/user_images/20190911/00/bp-chokoku/29/14/j/o1281088814583858387.jpg"><img alt="" height="291" src="https://stat.ameba.jp/user_images/20190911/00/bp-chokoku/29/14/j/o1281088814583858387.jpg" width="420"></a></p><p><a href="https://stat.ameba.jp/user_images/20190911/00/bp-chokoku/8e/ff/j/o1281088814583858341.jpg"><img alt="" height="291" src="https://stat.ameba.jp/user_images/20190911/00/bp-chokoku/8e/ff/j/o1281088814583858341.jpg" width="420"></a></p><p><a href="https://stat.ameba.jp/user_images/20190911/00/bp-chokoku/2a/64/j/o1281089414583858297.jpg"><img alt="" height="293" src="https://stat.ameba.jp/user_images/20190911/00/bp-chokoku/2a/64/j/o1281089414583858297.jpg" width="420"></a></p><p>&nbsp;</p><p>以上、30セット分のシミュレーション結果となります。</p><p>過去のレートシステムで行ったときと同様に、セットによっては何百試合も1800代に復帰できない、いわゆる下振れを引き続ける試合が発生しております。この結果の興味深いところは、<span style="font-weight:bold;">ハンドのかみ合わせが悪い試合が重なると、例え安定した実力を持つプレイヤーでも、何百試合も下振れが生じて順位が上がらない可能性が十分にあるところです</span>。</p><p>&nbsp;</p><p>また、これらの試合の実力レートを以下にまとめました。</p><p><a href="https://stat.ameba.jp/user_images/20190911/00/bp-chokoku/c7/11/j/o0273098414583858534.jpg"><img alt="" contenteditable="inherit" height="793" src="https://stat.ameba.jp/user_images/20190911/00/bp-chokoku/c7/11/j/o0273098414583858534.jpg" width="220"></a></p><p>&nbsp;</p><p>30セット分の実力レートの<span style="font-weight:bold;">平均値は1761</span>、<span style="font-weight:bold;">標準偏差は10程度</span>となりました。</p><p>記録した当時のJokerのボーダーが1760代だったのに対して<span style="font-weight:bold;">、30セット分のうち11セットは1750代以下の実力レート</span>となっており、Jokerに満たない結果となります。さらに、<span style="font-weight:bold;">最も低いものだと1738.6</span>となっております。これは当時の<span style="font-weight:bold;">実力ランキングでは24位程度の実力</span>となります。</p><p>&nbsp;</p><p>なお、Jokerクラスにまだなっておらずこれから目指す人は、まず安定して20位以内に入る実力をつけることを目標にすればいいと思います。</p><p>&nbsp;</p><p>以上、今回はレートの下振れ、上振れについての記事となりました。</p><p>下振れを引き続けていると、どうも自分の打ち方が悪くなってしまったと思いがちになります。確かにその影響もあると思いますが、かみ合わせ（＝運）の要素がレートに大きく作用していることを理解して頂ければと思います。</p><p>&nbsp;</p>
]]>
</description>
<link>https://ameblo.jp/bp-chokoku/entry-12523878370.html</link>
<pubDate>Wed, 11 Sep 2019 01:19:55 +0900</pubDate>
</item>
<item>
<title>ミリオンダウトにおける混合戦略ナッシュ均衡 その3</title>
<description>
<![CDATA[ <p>前回の記事から一年近く経とうとしてました。</p><p>Jokerクラスにタッチして調子づいたので更新しようと思いました。</p><p>&nbsp;</p><p>今回もタイトル通り、<span style="font-weight:bold;"><span style="text-decoration:underline;">混合戦略</span></span>に関する考察となります。</p><p><span style="text-decoration:underline;"><span style="font-weight:bold;">混合戦略</span></span><span style="font-weight:bold;">、</span><span style="text-decoration:underline;"><span style="font-weight:bold;">ナッシュ均衡</span></span>について分からない人は前々回の記事を参考にしてください。</p><p>今回、考察の対象とするのは、よくありがちな以下のケースとなります。</p><p>&nbsp;</p><p>「自分が<span style="font-weight:bold;">2で切って</span>、相手が<span style="font-weight:bold;">残り5枚</span>、自分が<span style="font-weight:bold;">残り4枚</span>となった。その後、<span style="font-weight:bold;">真または嘘のトリプルを</span>出して決着をつける。」</p><p>&nbsp;</p><p>この手の選択については、投げる相手を選ばなければならないこともあり、上級者でも意見が分かれたりします。</p><p>嘘が最も効果的となるハンドは<span style="font-weight:bold;">SSSSSS2 (ペアなし、2ハイ) </span>のようなハンドとなりますが、そもそもこのハンドで嘘を付く必要がないという意見もあれば、逆に積極的に嘘を付くべきだと考えている人もいるようです。</p><p>&nbsp;</p><p>確かに、母集団の平均レベルとしての「環境」や、「個人メタ」はあると思いますので、データを取ればどちらが正しいかを証明することはできるかもしれませんし、そのデータに基づけば実用的な意味での最適解は得られると思います。</p><p>&nbsp;</p><p>しかしそのような「基準の定まらない根拠」でプレイすることに対して納得できない方もいるのでは、と思いまして、前回に引き続き混合戦略ナッシュ均衡の考えで解を出しました。（ただし、前回も述べましたが、相手がオッズの概念を理解できる、すなわち中級者以上であるということが大前提となります）</p><p>&nbsp;</p><p>&nbsp;</p><p>今回のケースにおける<span style="font-weight:bold;"><span style="text-decoration:underline;">利得行列</span></span>は以下のようになります。</p><p>&nbsp;</p><p>表　2で切ってトリプルを投げた際の利得行列</p><p><a href="https://stat.ameba.jp/user_images/20190807/00/bp-chokoku/34/7a/j/o0629024314524836059.jpg"><img alt="" height="162" src="https://stat.ameba.jp/user_images/20190807/00/bp-chokoku/34/7a/j/o0629024314524836059.jpg" width="420"></a></p><p>&nbsp;</p><p>今回、自分(A)がとる選択肢は以下の3択となります。</p><p><span style="font-weight:bold;">①　SSSSSS2のハンドにおいて、嘘トリプルを投げずに♤プレイする。</span></p><p><span style="font-weight:bold;">②　TSSSS2のハンドにおいて、2で切ってトリプルを投げる。</span></p><p><span style="font-weight:bold;">③　SSSSSS2のハンドにおいて、嘘トリプルを投げる。</span></p><p>&nbsp;</p><p>表のx1、x2、x3はそれぞれ選択肢①～③を取る割合を示しています。</p><p>そのためx1+ x2+ x3 = 1となります。</p><p>また、x2に関しては、ハンド型SSSSSS2の頻度<span style="font-weight:bold;">(7.7%)</span>とTSSS2の頻度<span style="font-weight:bold;">(6.2%)</span>の比に基づいて<span style="font-weight:bold;">0.45</span>という固有値となります(説明は省きます)。</p><p>&nbsp;</p><p>表を埋めている数字について説明しますと、①を選択した場合の平均勝ち枚数は<span style="font-weight:bold;">-2</span>としています。</p><p>データを取ってみると分かりますが、ペアなし2ハイのハンドはそれほど勝てるハンドではありません。平均勝ち枚数-2は低すぎると思う人もいれば大きすぎる思う方もいるかもしれません（前回でも述べましたが、利得行列の数値はおおよその目安です）。</p><p>&nbsp;</p><p>続いて、②を選択してダウトをもらった場合は<span style="font-weight:bold;">8</span>枚勝ち、スルーされた場合は<span style="font-weight:bold;">4.5</span>枚勝ちとしています(真を返されることもあるため)。</p><p>③を選択した場合にダウトをもらった場合は<span style="font-weight:bold;">3.5</span>枚負け、スルーされた場合は<span style="font-weight:bold;">4</span>枚勝ちとしています。</p><p>&nbsp;</p><p>さて、このような数値の組み合わせで自分(A)の最適戦略を求めてみると、以下のような結果となります。</p><p>&nbsp;</p><p>自分(A)の最適戦略</p><p><span style="font-weight:bold;">x1=0.34</span></p><p><span style="font-weight:bold;">x2=0.45</span></p><p><span style="font-weight:bold;">x3=0.21</span></p><p>そのときの利得平均は<span style="font-weight:bold;">2.15</span></p><p>&nbsp;</p><p>したがって、混合戦略ナッシュ均衡によると、<span style="font-weight:bold;">「SSSSSS2のハンドは、♠プレイと嘘トリプルの選択の比率を x1： x3 = 0.34 ： 0.21に調整する、すなわち10回中4回は嘘トリプルの抽選を受ける」</span>が最善ということになります。</p><p>&nbsp;</p><p>その戦略を実践した場合、相手視点ではx3 / (x2+x3) =0.32 、<span style="font-weight:bold;">つまり32%の確率でトリプルに嘘がある</span>ことになります。その確率によって相手のダウトレンジとかも決まってきますが、それを書くとややこしくなるので今回はここまでにします。</p><p>&nbsp;</p><p>今回は混合戦略ナッシュ均衡の観点から、「あるハンドについてどれくらい嘘トリプルを投げることが許されるか」、というのを示しました。</p><p>&nbsp;</p><p>次回も何か考察したい内容があれば更新します。</p><p>&nbsp;</p>
]]>
</description>
<link>https://ameblo.jp/bp-chokoku/entry-12502330834.html</link>
<pubDate>Wed, 07 Aug 2019 01:32:21 +0900</pubDate>
</item>
<item>
<title>ミリオンダウトにおける混合戦略ナッシュ均衡　その2</title>
<description>
<![CDATA[ <p>前回の記事の続きになります。</p><p>前回は、初手4枚革命を投げる際に真と嘘をどのような配分にすれば最適か、また、受ける側はどのような配分ででスルーとダウトをすれば最適かを<span style="font-weight:bold;"><span style="text-decoration:underline;">混合戦略ナッシュ均衡</span></span>の観点から考察しました。</p><p>&nbsp;</p><p>今回も、同様の観点から一部のケースにおける最適解を考察します。</p><p>そのケースは以下です。</p><p>&nbsp;</p><p><span style="text-decoration:underline;"><span style="font-weight:bold;"><span style="background-color:#ffe57f;">◆ケース①</span></span></span></p><p>「自分が<span style="font-weight:bold;">残り5枚</span>で、相手が<span style="font-weight:bold;">残り1枚</span>、<span style="font-weight:bold;">自分が手番</span>のときに<span style="font-weight:bold;">bbを2回</span>出して何とか勝ち切りたい。なお、2回のbbのうち、片方は真でもう片方が嘘であることを相手側は知っているものとする」</p><p>&nbsp;</p><p>ケース①は、対戦中に相手からペアを全渡しされ、何らかの展開によってそのペアが残って自分に手番が回ったような状況です。これと全く同じケースになることは少ないと思いますが、連続してbbやbbbをする際にどちらから真を出すかで悩むような類似ケースは多いんじゃないかと思います。</p><p>&nbsp;</p><p>このケースを前回説明した<span style="font-weight:bold;"><span style="text-decoration:underline;">利得行列</span></span>にまとめると以下のようになります。</p><p>&nbsp;</p><p>表1 bb2回出しの際の利得行列</p><p><a href="https://stat.ameba.jp/user_images/20181008/01/bp-chokoku/d3/f0/j/o0486017414280037964.jpg"><img alt="" contenteditable="inherit" height="150" src="https://stat.ameba.jp/user_images/20181008/01/bp-chokoku/d3/f0/j/o0486017414280037964.jpg" width="420"></a></p><p>&nbsp;</p><p>自分側がA、相手側がBとします。</p><p>Aが1回目に嘘を付く確率を x、2回目に嘘を付く確率を 1-xとし、</p><p>Bが全スルーする確率を(1-y1-y2)、1回目にダウトする確率をy1、2回目にダウトする確率をy2としています。</p><p>なお、Aが1回目に真を投げて、Bにダウトされた場合の平均勝ち枚数は1～2枚となることが多いので、上の表では間をとって1.5としております。</p><p>&nbsp;</p><p>この利得行列を前回と同じ要領で解いた結果が以下の通りとなります。</p><p>計算過程は省略します。</p><p>&nbsp;</p><p>A側の最適解</p><p>x=　0.36　平均勝ち枚数 -0.84</p><p>B側の最適解</p><p>y1= 0.48、y2=0.52 平均勝ち枚数 +0.84</p><p>&nbsp;</p><p>なお、<span style="font-weight:bold;"><span style="text-decoration:underline;">Bは2回ともスルーする選択は明らかに損</span></span>なので、Bは1回目か2回目かどちらか必ずダウトすることが最適解となります。</p><p>&nbsp;</p><p><span style="text-decoration:underline;"><span style="font-weight:bold;"><span style="background-color:#ffe57f;">◆ケース②</span></span></span></p><p>「自分が<span style="font-weight:bold;">残り7枚</span>で、相手が<span style="font-weight:bold;">残り1枚</span>、<span style="font-weight:bold;">自分が手番</span>のときに<span style="font-weight:bold;">bbbを2回</span>出して何とか勝ち切りたい。なお、2回のbbbのうち、片方は真でもう片方が嘘であることを相手側は知っているものとする」</p><p>&nbsp;</p><p>ケース①とは自分の残り枚数が異なり、bbではなくbbbを投げる状況になります。</p><p>利得行列にまとめると以下になります。</p><p>&nbsp;</p><p>表2 bbb2回出しの際の利得行列</p><p><a href="https://stat.ameba.jp/user_images/20181008/03/bp-chokoku/1f/7c/j/o0486017414280056689.jpg"><img alt="" contenteditable="inherit" height="150" src="https://stat.ameba.jp/user_images/20181008/03/bp-chokoku/1f/7c/j/o0486017414280056689.jpg" width="420"></a></p><p>&nbsp;</p><p>この場合の結果は以下の通りとなります。</p><p>&nbsp;</p><p>A側の最適解</p><p>x=　0.31　平均勝ち枚数 -1.5</p><p>B側の最適解</p><p>y1= 0.5、y2=0.5 平均勝ち枚数 +1.5</p><p>&nbsp;</p><p>x もy1 も概ねケース①に近い値となりました。</p><p>&nbsp;</p><p><span style="text-decoration:underline;"><span style="font-weight:bold;">～まとめ～</span></span></p><p>上記ケースにおいて2回連続でbbまたはbbb投げる際は、1回目に約30%の確率で嘘を投げることが最適となります。一方で受ける側は、どちらか一方をランダムにダウトすれば最適となります。1回目に真を投げる方がいいのは混合戦略を取り上げるまでもなく基本中の基本ですが、上級者同士の戦いだと嘘をいくらか混ぜる必要があるということになります。</p><p>&nbsp;</p><p>次回は、ハンドの型に関する考察を書く予定です。</p>
]]>
</description>
<link>https://ameblo.jp/bp-chokoku/entry-12410368232.html</link>
<pubDate>Mon, 08 Oct 2018 03:41:51 +0900</pubDate>
</item>
<item>
<title>ミリオンダウトにおける混合戦略ナッシュ均衡</title>
<description>
<![CDATA[ <p><b><span lang="EN-US" style="background:#FFF3C3">◆</span><span style="background:#FFF3C3">ナッシュ均衡（混交戦略ナッシュ均衡）</span></b><span lang="EN-US"><o:p></o:p></span></p><p><b><u>ナッシュ均衡</u></b>とはゲーム理論における用語の一つです。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>自分と対戦相手がお互いにゲームで勝つために合理的な選択をしようとするプレイヤーであることを前提とした際、それぞれある選択肢を変更すると自身の利益を減らすことに繋がり、<b><u>その選択肢以外に変更のしようがない均衡状態</u></b>になるケースがあります。その選択肢をナッシュ均衡といいます。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>ミリオンダウトは自分と相手が「嘘をつく」「真を投げる」「ダウト」「スルー」などの選択肢の組み合わせによって<b><u>勝ち枚数を巡る駆け引きが生じるゲーム</u></b>です。したがって、ミリオンダウトでも一部のケースにおいてはナッシュ均衡が存在します。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>ナッシュ均衡を把握するとミリオンダウトの実レが劇的に上がるわけではないと思いますが、<b><u>合理的な上級プレイヤー同士の対戦において、どのような駆け引きが行われているゲームなのかがより明確になる</u></b>と思います。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>上記で述べたいくつかの選択肢の組み合わせによってこのゲームの勝敗が決まりますが、ゲーム中に例えば「ダウト」や「スルー」を選ぶ基準は初期に配られた７枚の札の強さが判断材料の一つになります。したがって上記の選択肢の選び方はプレイヤーによって個人差はあれど確率によって支配されていると言えます。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>このようにお互いがある一定の比率で選択肢を選んで勝ち枚数の駆け引きが行われている状況での合理的戦略を<b><u>混合戦略</u></b>といい、その際、お互いがお互いの比率を把握していることを前提としたナッシュ均衡を<b><u>混合戦略ナッシュ均衡</u></b>と言います。ミリオンダウトの駆け引きにおける均衡状態はこの混合戦略ナッシュ均衡に該当します。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>一例として、先攻の<span lang="EN-US">A</span>が初手に<span lang="EN-US">4</span>枚革命（嘘または真）を投げ、<span lang="EN-US">B</span>が「ダウト」か「スルー」するかという、ありがちな状況について考えます。ここで、各自の選択肢とその選択肢を選んだ結果による<span lang="EN-US">A</span>の平均勝敗枚数<span lang="EN-US">(</span>以後、勝ち枚数と呼ぶ<span lang="EN-US">)</span>を以下の<span lang="EN-US">①</span>～<span lang="EN-US">④</span>の４パターンと仮定します。（<span lang="EN-US">②</span>～<span lang="EN-US">④</span>の勝ち枚数は大体の目安です。多少、人によって見積もり方の違いはあると思います。）<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p><span lang="EN-US">①A</span>が真革命を投げ、<span lang="EN-US">B</span>がダウトする　<span lang="EN-US">⇒</span>　<span lang="EN-US">A</span>の勝ち枚数は<span lang="EN-US">+11<o:p></o:p></span></p><p><span lang="EN-US">②A</span>が真革命を投げ、<span lang="EN-US">B</span>がスルーする　<span lang="EN-US">⇒</span>　<span lang="EN-US">A</span>の勝ち枚数は<span lang="EN-US">-2<o:p></o:p></span></p><p><span lang="EN-US">③A</span>が嘘革命を投げ、<span lang="EN-US">B</span>がダウトする　<span lang="EN-US">⇒</span>　<span lang="EN-US">A</span>の勝ち枚数は<span lang="EN-US">-5<o:p></o:p></span></p><p><span lang="EN-US">④A</span>が嘘革命を投げ、<span lang="EN-US">B</span>がスルーする　<span lang="EN-US">⇒</span>　<span lang="EN-US">A</span>の勝ち枚数は<span lang="EN-US">+7<o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>この<span lang="EN-US">①</span>～<span lang="EN-US">④</span>のケースを以下の表にまとめます。このようにそれぞれのパターンにおける利益（ここでは<span lang="EN-US">A</span>の勝ち枚数）をマトリックスにまとめたものを<b><u>利得行列</u></b>と呼びます。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>表<span lang="EN-US">1. A</span>が初手革命を投げる際の利得行列<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><a href="https://stat.ameba.jp/user_images/20180928/00/bp-chokoku/8d/06/j/o0410015214274106412.jpg"><span style="color:blue;mso-no-proof:yes;text-decoration:none;text-underline:none"><!--[if gte vml 1]><v:shapetype id="_x0000_t75" coordsize="21600,21600" o:spt="75" o:preferrelative="t" path="m@4@5l@4@11@9@11@9@5xe" filled="f" stroked="f"> <v:stroke joinstyle="miter"/> <v:formulas>  <v:f eqn="if lineDrawn pixelLineWidth 0"/>  <v:f eqn="sum @0 1 0"/>  <v:f eqn="sum 0 0 @1"/>  <v:f eqn="prod @2 1 2"/>  <v:f eqn="prod @3 21600 pixelWidth"/>  <v:f eqn="prod @3 21600 pixelHeight"/>  <v:f eqn="sum @0 0 1"/>  <v:f eqn="prod @6 1 2"/>  <v:f eqn="prod @7 21600 pixelWidth"/>  <v:f eqn="sum @8 21600 0"/>  <v:f eqn="prod @7 21600 pixelHeight"/>  <v:f eqn="sum @10 21600 0"/> </v:formulas> <v:path o:extrusionok="f" gradientshapeok="t" o:connecttype="rect"/> <o:lock v:ext="edit" aspectratio="t"/></v:shapetype><v:shape id="図_x0020_1" o:spid="_x0000_i1025" type="#_x0000_t75" alt="https://stat.ameba.jp/user_images/20180928/00/bp-chokoku/8d/06/j/o0410015214274106412.jpg" href="https://stat.ameba.jp/user_images/20180928/00/bp-chokoku/8d/06/j/o0410015214274106412.jpg" style='width:307.8pt;height:114pt;visibility:visible;mso-wrap-style:square' o:button="t"> <v:imagedata src="file:///C:\Users\onishi\AppData\Local\Temp\msohtmlclip1\01\clip_image001.jpg"  o:title="o0410015214274106412"/></v:shape><![endif]--><!--[if !vml]--></span></a></span><a href="https://stat.ameba.jp/user_images/20180928/00/bp-chokoku/8d/06/j/o0410015214274106412.jpg"><img alt="" contenteditable="inherit" height="152" src="https://stat.ameba.jp/user_images/20180928/00/bp-chokoku/8d/06/j/o0410015214274106412.jpg" width="410"></a></p><p>&nbsp;</p><p>この利得行列を基に、混合戦略ナッシュ均衡を求めてみます。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US">A</span>が真革命する割合を<span lang="EN-US">x</span>、嘘革命する割合を<span lang="EN-US">(1-x)</span>とします（<span lang="EN-US">0≦x≦1</span>、<span lang="EN-US">0≦y≦1)<o:p></o:p></span></p><p>一方で、<span lang="EN-US">B</span>がダウトする割合を<span lang="EN-US">y</span>、スルーする割合を<span lang="EN-US">(1-y)</span>としてます。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>このとき、<span lang="EN-US">A</span>の勝ち枚数の期待値は、真革命を投げた場合と嘘革命を投げた場合とでそれぞれ以下の通りです。<span lang="EN-US"><o:p></o:p></span></p><p>真革命を投げた際の期待値・・・<span lang="EN-US">11xy -2x(1-y) = <b><u>13xy -2x</u></b><o:p></o:p></span></p><p>嘘革命を投げた際の期待値・・・<span lang="EN-US">-5(1-x)y +7(1-x)(1-y) = <b><u>12xy -7x -12y +7</u></b><o:p></o:p></span></p><p>その合計は・・・<span lang="EN-US">25xy -9x -12y +7 =<b><u> (25x -12)(y -9/25) +67/25</u></b></span>　<span lang="EN-US">①</span>式<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p><span lang="EN-US">①</span>式について、以下のことが分かります。<span lang="EN-US"><o:p></o:p></span></p><p>　<span lang="EN-US">x = 12/25</span>のとき・・・・<span lang="EN-US">y</span>によらず<span lang="EN-US">A</span>の勝ち枚数の期待値は<span lang="EN-US"> 67/25</span>となる。<span lang="EN-US"><o:p></o:p></span></p><p>　<span lang="EN-US">x &lt; 12/25</span>のとき・・・<span lang="EN-US">9/25 &lt; y ≦ 1</span>において<span lang="EN-US">A</span>の勝ち枚数の期待値が<span lang="EN-US">67/25</span>を下回る。<span lang="EN-US"><o:p></o:p></span></p><p>　<span lang="EN-US">x &gt; 12/25</span>のとき・・・<span lang="EN-US">0 ≦ y &lt; 9/25</span>において<span lang="EN-US">A</span>の勝ち枚数の期待値が<span lang="EN-US">67/25</span>を下回る。<span lang="EN-US"><o:p></o:p></span></p><p>すなわち<span lang="EN-US">A</span>は<span lang="EN-US">x=12/25</span>としない限り、<span lang="EN-US">B</span>が<span lang="EN-US">y</span>を上げ下げすることによって最大の<span lang="EN-US">67/25</span>を狙えなくなる。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>また、<span lang="EN-US">B</span>が被る損失（以下、負け枚数）について、以下のことが分かります。<span lang="EN-US"><o:p></o:p></span></p><p>　<span lang="EN-US">y = 9/25</span>のとき・・・<span lang="EN-US">x</span>によらず<span lang="EN-US">B</span>の負け枚数の期待値は<span lang="EN-US">67/25</span>となる。<span lang="EN-US"><o:p></o:p></span></p><p>　<span lang="EN-US">y &lt; 9/25</span>のとき・・・<span lang="EN-US">0 ≦ y &lt; 12/25</span>において<span lang="EN-US">B</span>の負け枚数の期待値が<span lang="EN-US">67/25</span>を超える。<span lang="EN-US"><o:p></o:p></span></p><p>　<span lang="EN-US">y &gt; 9/25</span>のとき・・・<span lang="EN-US">12/25&nbsp;&lt; x&nbsp;≦ 1</span>において<span lang="EN-US">B</span>の負け枚数の期待値が<span lang="EN-US">67/25</span>を超える。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>このことから、お互いに自身の利益を最大化（または損失を最小化）するための最適選択がそれぞれ<b><u><span lang="EN-US">x=12/25(=0.48)</span></u></b>と<b><u><span lang="EN-US">y=9/25(=0.36)</span></u></b>であることが分かります。<span lang="EN-US">&nbsp; </span><b><u>この値がこのケースにおける混合戦略ナッシュ均衡となります</u></b>。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>まとめると、<span lang="EN-US">A</span>と<span lang="EN-US">B</span>のそれぞれの最適戦略は以下の通りとなります。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p><span lang="EN-US">A</span>側<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US">48%</span>の割合で真革命<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US">52%</span>の割合で嘘革命<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p><span lang="EN-US">B</span>側<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US">36%</span>の割合でダウト<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US">64%</span>の割合でスルー<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p><b><span lang="EN-US" style="background:#FFF3C3">◆</span><span style="background:#FFF3C3">混交戦略ナッシュ均衡を基にしたダウトレンジと嘘レンジ</span></b><span lang="EN-US"><o:p></o:p></span></p><p>ここまで明らかとなった上で、次に考えてみたくなるのが、<b><u><span lang="EN-US">A</span>側はどのようなハンドで嘘革命すべきか</u></b>、または<b><u><span lang="EN-US">B</span>側はどのようなハンドでダウト<span lang="EN-US">(</span>またはスルー）すべきか</u></b>です。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>利得行列を基準にすると、<span lang="EN-US">A</span>側は<b><u><span lang="EN-US" style="color:black">(a)</span>嘘革命を通した後に７枚勝ちできるハンド</u></b>、<span lang="EN-US">B</span>側は<b><u><span lang="EN-US">(b)</span>嘘革命をダウト成功（または真革命をスルー成功）した後なるべく勝枚数を稼げるハンド</u></b>が望ましいといえます。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p><span lang="EN-US">(a)</span>に関して、<b><u>初手真革命を引く確率は約<span lang="EN-US">5%</span></u></b>です。<span lang="EN-US"><o:p></o:p></span></p><p>最適戦略によると、嘘と真の比率が<span lang="EN-US">48:52</span>でほぼ<span style="font-style:italic;">1:1</span>なので<b><u>嘘革命ハンドも<span lang="EN-US">5%</span>程度投げることが最適解</u></b><span style="font-weight:bold;"><span style="text-decoration:underline;">となるのでしょうか。いや、その5%の中には初手に投げる必要のないハンドもあるため、実際は<span style="font-style:italic;">4%</span>ほどが最適解と考えられます。</span></span></p><p>嘘革命を投げるべきハンドは、それ以外のムーブでは勝枚数が稼ぎにくい以下のようなタイプが候補となります。（少なくとも、均衡時における平均勝枚数である<span lang="EN-US">65/25(≒2.7)</span>よりは明らかに稼げないハンドで嘘革命を投げたい。）<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>・<span lang="EN-US">38SSSSS (38</span>持ち<span lang="EN-US">,2</span>無し<span lang="EN-US">,</span>シングルのみ<span lang="EN-US">)</span>　<b><u>頻度<span lang="EN-US">2.1%</span></u><span lang="EN-US"> ⇒</span>優先度<span lang="EN-US">(</span>高<span lang="EN-US">)</span></b><span lang="EN-US"><o:p></o:p></span></p><p>・<span lang="EN-US">LLSSSSS(3</span>～<span lang="EN-US">4</span>ペア持ち<span lang="EN-US">,2</span>無し<span lang="EN-US">,</span>残りシングル<span lang="EN-US">)<b><u> </u></b></span><b><u>頻度<span lang="EN-US">3.2%</span></u></b><span lang="EN-US"> <b>⇒</b></span><b>優先度<span lang="EN-US">(</span>中<span lang="EN-US">)</span></b><span lang="EN-US"><o:p></o:p></span></p><p>・<span lang="EN-US">34SSSSS(34</span>持ち<span lang="EN-US">,28</span>無し<span lang="EN-US">,</span>シングルのみ<span lang="EN-US">) </span><b><u>頻度<span lang="EN-US">1.1%</span></u><span lang="EN-US"> ⇒</span><u>優先度<span lang="EN-US">(</span>低<span lang="EN-US">)</span></u></b><span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p> </o:p></span></p><p><span lang="EN-US">38SSSSS</span>に関しては優先度が最も高く、相手が上級者なら必ず初手嘘革命を投げておきたいハンドとなります。その他<span lang="EN-US">LLSSSSS</span>や<span lang="EN-US">34SSSSS</span>なども候補に挙がります。もちろん、嘘革命以外で稼ぎにくいハンドであれば上記以外のハンドも選択肢としてアリだと思います。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>ここで重要なのは、対戦相手は人間ですので必ずしも最適解に従わないということです。しかしこちらが最適解を一方的に知っておけば、相手のプレイスタイル（最適解からどれだけズレているか）に応じて嘘レンジを調整することで、理論上は相手からの一方的な搾取が可能となります。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>次に<span lang="EN-US">(b)</span>に関して、<b><u><span lang="EN-US">Jo</span>を<span lang="EN-US">1</span>枚以上もっているなら、ハンドの強さ的にも、相手が嘘革命投げる条件付き確率的にもダウトを打つべき</u></b>でしょう。これだけでほぼダウトを打つべきハンドとなります。<b><u>残る<span lang="EN-US">11%</span>のハンドは、<span lang="EN-US">Jo</span>を含まないハンドの中で勝ち枚数が大きくなりやすいハンドを選べばいい</u></b>ことになります。候補としては以下のようなハンドです。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>・<span lang="EN-US">Jo</span>持ちハンド <b><u>頻度<span lang="EN-US">24%</span></u></b><span lang="EN-US"><o:p></o:p></span></p><p><b>・</b><span lang="EN-US">Jo</span>無しの以下のハンド<span lang="EN-US"><o:p></o:p></span></p><p>　・<span lang="EN-US">TPSS</span>以上のまとまったハンド<span lang="EN-US">&nbsp; </span><b><u>頻度<span lang="EN-US">3.7%</span></u></b><span lang="EN-US"><o:p></o:p></span></p><p>　・<span lang="EN-US">PPPS (</span>ペア<span lang="EN-US">3</span>組<span lang="EN-US">+</span>シングル<span lang="EN-US">) </span><b><u>頻度<span lang="EN-US">1.5%</span></u></b><span lang="EN-US"><o:p></o:p></span></p><p>　・<span lang="EN-US">PPSS2 (</span>ペア<span lang="EN-US">2</span>組<span lang="EN-US">,2</span>持ち<span lang="EN-US">)&nbsp; </span><b><u>頻度<span lang="EN-US">4.4%</span></u></b><span lang="EN-US"><o:p></o:p></span></p><p>　・<span lang="EN-US">PSSS82 (</span>ペア<span lang="EN-US">1</span>組<span lang="EN-US">,82</span>持ち<span lang="EN-US">) </span><b><u>頻度<span lang="EN-US">3.6%</span></u></b><span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>上記の範囲までで最適解である<span lang="EN-US">36%</span>程度のダウトレンジとなります。もちろん嘘革命を投げる際と同様に、相手が初心者や嘘を付きやすいプレイヤーならば、上記ハンドよりも若干弱めのレンジからでもダウトが最適ということになります。<span lang="EN-US"><o:p></o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p><span lang="EN-US"><o:p>&nbsp;</o:p></span></p><p>今回はミリオンダウトにおける混合戦略ナッシュ均衡について、初手嘘革命を投げたケースを例に考察を行いました。次回はそれ以外のケースについて同様の考察を行う予定です。<span lang="EN-US"><o:p></o:p></span></p>
]]>
</description>
<link>https://ameblo.jp/bp-chokoku/entry-12408055749.html</link>
<pubDate>Fri, 28 Sep 2018 00:40:06 +0900</pubDate>
</item>
</channel>
</rss>
