(注:这个博弈是网球击球博弈,其中L / R分别代表 决策人 I 是像左击球还是向右,l / r 则表示决策人II 是向左防守还是向右防守。
其中的数字,分别代表两个决策人在选择了策略后他们得分的概率,之所以在猜错边依然不能100%得分,是因为有可能会基础边线。而之所决策人 II猜到 I 打右边仍旧 是20:80,不是50:50,是因为考虑到 I 的右边正好是 II 的左边为非利手方向难以防守。
很明显这个博弈不存在纯策略的NE,所以不同颜色的 p 和 q 代表了允许使用混合策略时它们对纯策略的概率选择)
那么我们如何求出 p 和 q 的值呢?
根据推论2可知:
对于决策人 I 有, Eu1(L,Pii)= Eu1(R,Pii)
即,50q +80(1 - q)= 90q + 20(1 - q)
则 q = 0.6
同理,可得 p = 0.7
则,这个网球博弈的 NE = [(0.7,0.3),(0.6,0.4)]
我们继续思考这个NE的结论,它到底有什么实际意义呢?
如果你发现,参与人 II 的 防守左边的概率 大于均衡q ,即0.6,那么你该怎么做?
答案是,一直打右边 —— 一个纯策略。
如果参与人 II 防守左边的概率小于0.6,你该怎么做?
答案是,一直打左边........
(我最初看到这个结果蛮懵比的,后来想想,如果0.6是Eu1(L,Pii)和 Eu1(R,Pii)的分界,那么当大于或小于0.6时,两者就不相等了。显然是,大于0.6时, Eu1(R,Pii)>Eu1(L,Pii),所以为了最大化我们的利益,肯定是一直打右边啊........同理,小于0.6时,一直打左边。)
我们继续来思考另一个问题,如果 II 选手经过练习,改变了左边防守的收益,如图:
(黄色部分为改变收益的部分,原来为50;50)
那么,NE情况下q 如何变化?
对于这个重新改变的博弈,存在着对 q 的两种影响:
1)直接影响:练习正手接球,使得参与人 II 更自信面对,从而使得他更多增加防守左边的概率,也即 q 增大
2)战略影响:在参与人 II 练习之后, 参与人 I 知道了这个状况,因此他便不再发到左边了,跟多发向右边。参与人 II 根据 I 的改变,自然更多防守右边了。从而使得q 减小