友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!
策略思维-第21部分
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部! 如果本书没有阅读完,想下次继续接着阅读,可使用上方 "收藏到我的浏览器" 功能 和 "加入书签" 功能!
功回球概率沿着图中的两条直线上升到交点之上,也就是超过48%。因此,40%的时间瞄准对方的正手就是发球者的最佳策略。
混合策略的确切比例是由基本行动配对而成的4种情况确定的。对于拥有不同的绝对优势和相对优势的选手,这里的数字90、60、30
和20会相应发生变化,而他们的最佳混合策略也会随之不同。我们很快就会发现,这样一些变化可能导致一些令人惊讶的结果。这里的关键在于,你必须通过估计你真正参加的博弈的4种基本情况,确定自己的最佳混合策略。
这里有一条捷径,使你不必画出前面提到的图表也可以计算出均衡策略。这个简单的算术方法归功于J。D.威廉斯。'3'回到基本情况的表格。对于发球者,如果选择瞄准对方正手的策略,就要观察对方选择两种不同的回应方式之一会使结果发生什么变化;我们得到90…30=60
。假设他瞄准对方反手发球,再做同样的计算,可得60…20=40 。将上述数字倒过来排列,就能得到最佳混合策略中采用这两种策略的概率。①
因此,发球者应该按照40:60的比例瞄准对方的正手和反手。
现在我们改从接球者的角度考察同一场比赛。图7…4显示了他的不同选择会有什么不同的结果。假如发球者瞄准他的反手,那么,他回①
我们可以用一点代数知识验证这个结果。假如纵列选手的得失情况如下图所示,左列对右列的均衡比例为(D…B):(
A…C)。纵列选手选择左列的概率是p,那么,无论横行选手选择上或者下都没有关系;pA+(1…p)B=pC十1…P)D 意味着p /(
1…p )=(D…B )/(A…C)
,如前所述。由于横行选手的得失是纵列选手的得失的负数,他的均衡混合策略就是上行对下行,即(D…C):(A…B)。
球的时候向反手方移动就能得到60%的成功回球概率,而向正手方移动的成功回球概率只有20%。从O到100%改变向正手方移动的概率,就得到一条和上述两点相交的直线。与前面的分析类似,若是发球者瞄准对手的正手,我们就得到一条从30%上升到90%的直线。这两条直线交于一点,在这一点,接球者向正手方移动的概率为30%
,无论发球者选择瞄准哪一方,他的成功回球概率始终维持在48%。任何其他混合策略都会让发球者占便宜,使他得以选择更好的策略,将接球者的成功回球概率进一步降低到48%以下。
图7…4 接球手向正手移动的概率(% )
此外,我们也可以采用威廉斯的方法。表格显示了接球者两种不同选择可能导致什么不同结果。若向正手方移动,我们得到90…20=70 ;
向反手方移动,我们得到60…30=30。将这两个数字倒过来排列就得到最佳混合策略的比例:30%的时间准备向正手方移动,70%的时间准备向反手方移动。
你可能已经注意到,从两位选手的不同角度计算最佳混合策略,会得到一个有趣的共同点:两次计算会得到同样的成功回球概率,即48%。接球者若采用自己的最佳混合策略,就能将发球者的成功概率拉低到发球者采用自己的最佳混合策略所能达到的成功概率。这并非巧合,而是两个选手的利益严格对立的所有博弈的一个共同点。这个结果称为最小最大定理,由前普林斯顿数学家约翰·冯·诺伊曼(John
von Nrumann)与奥斯卡·摩根斯顿(Oscar
Morgenstern)创立。这一定理指出,在零和博弈里,参与者的利益严格相反(一人所得等于另一人所失),每个参与者尽量使对手的最大收益最小化,而他的对手则努力使自己的最小收益最大化。他们这样做的时候,会出现一个令人惊讶的结果,即最大收益的最小值(最小最大收益)等于最小收益的最大值(最大最小收益)。双方都没办法改善自己的地位,因此这些策略形成这个博弈的一个均衡。
我们以网球比赛为例,并假设每个选手只有两种策略,以此证明这一定理。假如发球者想努力使接球者的最大成功率最小化,他应该在假设接球者已经正确预计到他的混合策略且会做出最优回应的基础上确定自己的行动。也就是说,接球者的成功率将是图7…5中两条直线的最大值。这个最大值的最小值出现在两条直线的相交处,该点的成功率为48%。
图7…5发球手攻正手的概率(% )
现在我们从接球者的角度考察这个问题:他要努力使自己的最小收益最大化。如图7…6所示,假如接球者一半时间向正手方移动,一半时间向反手方移动,他的新的收益曲线就是原来两条直线的平均值,以点线显示。由于这条直线是向上延伸的,其最小值永远出现在左端,该点的成功率为40%。无论接球者向两方移动的比例是多少,这条直线一定经过成功率为48%的那一点,这是因为发球者可以选择采用40:60的混合策略。假如这条直线出现任何倾斜,那么,它的一端一定落在48%以下。只有在接球者的混合策略为30:70的时候,这条直线才会变成一条水平直线,最小值变成48%。因此,最大值的最小值等于最小值的最大值——48%。
图7…6发球手攻正手的概率(%)
最小——最大定理的普遍证明相当复杂,不过,其结论却很有用,应该记住。假如你想知道的只不过是一个选手之得或者另一个选手之失,你只要计算其中一个选手的最佳混合策略并得出结果就行了。
我们的其他工具,比如威廉斯的方法和上述图表,能够很好地解决一切只有两个选手参加且他们各有两个策略的零和博弈。不幸的是,这些工具并不适用于任何非零和博弈,也不适用于选手数目超过两个或者他们拥有的策略数目超过两个的零和博弈。经济学家和数学家发明了更加普遍的技巧,比如线性规划方法,可以找出最复杂的零和博弈的均衡策略。虽然这些技巧超出了本书的范围,我们还是可以利用其中得出的结果。
所有混合策略的均衡具有一个共同点:每个参与者并不在意自己在均衡点的任何具体策略。一旦有必要采取混合策略,找出你自己的均衡混合策略的途径就在于使别人对他们自己的具体行动无所谓。虽然这听上去像是一种倒退,其实不然,因为它正好符合零和博弈的随机化动机:你想阻止别人利用你的有规则的行为占你的便宜。假如他们确实倾向于采取某一种特别的行动,从你的角度观察,这只能表示他们选择了最糟糕的方针。
说到这里,我们已经解释了采取混合或者随机策略的好处,以及这么做的策略必要性。基本要点在于,运用偶然性防止别人利用你的有规则的行为占你的便宜。将这一原理用于实践则是一个更微妙的间题。下面五个部分可以看做是运用混合策略的迷你指南。
3 .为什么你应该选择正确的混合策略?
假如真能发现某个参与者打算采取一种行动方针,而这种行动方针并非其均衡随机混合策略,另一个参与者就可以利用这一点占他的便宜。在网球比赛的例子中,当发球者采取自己的均衡策略,按照40:60的比例选择攻击对方正手方和反手方时,接球者的成功率为48%。如果发球者采取其他比例,接球者的成功率就会上升。举个例子:假如发球者很傻,决定把所有的球都发向对方较弱的反手方,接球者由于早有预料,其成功率将会增至60%。一般来说,假如接球者认识发球者,确切了解他有什么癖好,他就能相应采取行动。不过,这么做永远存在一种危险,即发球者可能是一个更出色的策略家,好比台球桌旁的骗子,懂得在无关紧要的时候装出只会采用糟糕策略的傻样,引诱对方上当,然后在关键时刻发挥本色,打接球者一个措手不及。一旦接球者以为看穿了对方的惯用手法,而放弃自己的均衡混合策略,一心要占对方便宜,就会上发球者的当。发球者乍看起来很傻的混合策略可能只是一个陷阱。只有采取自己的均衡混合策略才能避免这一危险。
与正确的混合比例一样重要的是随机性的本质。假如发球者向接球者正手方发出4个球,然后转向反手方发出6个球,接着又向正手方发4个球,再向反手方发6个球,如此循环,确实可以达到正确的混合比例。不过,这是一种有规则的行为,接球者很快就能洞察其中奥妙。他可以相应做出正确的移动,成功率因此上升为(4/10)90%+(6/10)60%=72%。发球者若想取得最大效果,必须使每一次发球都不可预测。前面故事里提到的棒球选手戴克斯特拉与史密斯,似乎没意识到这个原则。
4 .为什么不能依赖对手的随机化?
假如一个参与者选择的是他的最佳混合策略,那么,无论对手采取什么样的策略,他的成功率都是一样的。假设你是网球比赛例子里的接球者,而发球者已经选择了他的最佳混合策略,即40:60的混合策略。那么,无论你向正手方还是反手方移动,又或是时而正手方,时而反手方,你的成功回球率都是48%。意识到这一点,你可能打算免掉计算自己的最佳混合策略的麻烦,只随便选定一种行动,并指望对手选择他的最佳混合策略。问题在于,除非你选择自己的最佳混合策略,否则你的对手就没有动机选择他自己的最佳混合策略。举个例子:假如你选择向正手方移动,他会转向攻击你的反手方。为什么你应该选择自己的最佳混合策略?理由就是迫使对方继续使用他的最佳混合策略。
5 .你的技巧变化了,你的最佳混合策略怎样变化?
假设接球者努力改进自己的反手回球技巧,反手方的成功回球率从60%上升为65%。我们可以相应修改用于计算他的最佳混合策略的图表。请看图7…7。我们注意到,接球者向正手方移动的比例从30%上升为33。3%
,而整体成功回球率也从48%上升为50%。
图7…7 接球手向正手移动的概率(% )
随着接球者的技巧不断改进,他的成功率自然也会提高。不过,出人意料的是,这一提高了的成功率是由减少使用改进了的反手技巧取得的。在第1章的妙手传说中,我们说过这样的事情有可能发生;现在我们就来解释一下。
原因在于两位参与者的策略的相互影响。当接球者更善于反手回球,发球者就会多向他的正手方发球(向正手发球的比率达到43%,
而不是原来的40%)。为了适应这个变化,接球者也会多向正手方移动。反手技巧改进了,正手技巧的威力也因此释放出来。好比拉里·伯德的例子,随着他的左手投篮得分率上升,对方防守他的策略不得不发生同样的改变,结果反而给了他更多机会右手投篮。
同样的情况还有一个例子:假设接球者刻苦训练,提高自己的灵活性,从而他在向正手方移动后迅速转向接住反手球的准确度提高了。他对付反手球的成功率从20%上升为25%。和前面提到的情况一样,他向正手方移动的机会也从30%上升到31。6%
(若用威廉斯的方法,向正手方和反手方移动的比例从原来的30:70上升为35:65)。接球者多向正手方移动的原因在于他在这边的技巧改善了。相应地,发球者将会减少攻击对方的反手方的次数,以此减少对方的得益。
6 .怎样随机行动?
假如有人告诉你,你应该以相等的比例随机投出下坠球和快球,你该怎么办?一个办法是从1到10中随机挑选出一个数字。假如这个数字是5或在5以下,你就投快球;假如这个数字是6或在6以上,你就投下坠球。当然了,这在简化你的问题的方向上只走了一步而已。你怎样才能从1到10的十个数字里随机挑选出一个呢?
我们从一个更简单的问题开始,即写下连续投掷一枚硬币可能得出的结果。假如这个序列的确是一个随机序列,谁要是打算猜测你究竟写的是正面还是反面,他猜中的机会平均不会超过50%。不过,写下这么一个“随机”序列比你想像的要困难得多。
心理学家已经发现,人们往往会忘记这样一个事实,即投掷硬币翻出正面之后再投掷一次,这时翻出正面的可能性与翻出反面的可能性相等;这么一来,他们连续猜测的时候就会不停地从正面跳到反面,很少出现连续把宝押在正面的情况。假如一次公平的硬币投掷连续30次翻出正面,第31次投掷翻出正面的机会还是跟翻出反面的机会相等。根本没有“正面已经翻完”这回事。同样,在六合彩中,上周的号码在本周再次成为得奖号码的机会,跟其他任何号码相等。为避免一不小心在随机性里加人规律因素,我们需要一个更加客观或者更加独立的机制。
一个诀窍在于选择某种固定的规则,一但要是一个秘密的而且足够复杂的规则,人们很难破解。举个例子:看看我们的句子的长度。假如一个句子包含奇数个单词,把它当做硬币的正面;假如一个句子包含偶数个单词,把它当做反面。这就变成一个很好的随机数字发生器。回过头来计算前面的10个句子,我们得到反、正、正、反、正、反、正、正、正、反。假如我们这本书不够轻便,没关系,其实我们随时随地都带着一些随机序列。比如朋友和亲属的出生日期的序列。若出生日期是偶数,当做正面;若是奇数,当做反面。也可以看你的手表的秒针。假如你的手表不准,别人没办法知道现在秒针究竟处于什么位置。对于必须使自己的混合策略比例维持在50:50的棒球投手,我们的建议是,每投一个球,先瞅一眼自己的手表。假如秒针指向一个偶数,投一个快球;假如指向奇数,投一个下坠球。实际上,秒针可以帮助你获得任何混合策略比例。比如,现在你要用40%的时间投快球而用另外60%的时间投下坠球,那么,请选择在秒针落在1…24之间的时候投快球,落在25…60之间的时候投下坠球。
7 .独一无二的情况
至此为此,上述所有推理过程都适用于橄榄球、篮球或者网球这样的比赛,在这些比赛中,相同的情况多次出现,而且每场比赛对垒的都是相同的参与者。于是,我们就有时间和机会看出任何有规则的行为,并相应采取行动。反过来,很重要的一点,在于避免一切会被对方占便宜的模式,坚持自己的最佳混合策略。不过,若是遇到只比一次的比赛,又该怎么办?
考察一场战役攻守双方的选择。这种情况通常都是独一无二的,彼此都不能从对方以前的行动中得出任何规律。但是,派出间谍侦察的可能性会引出一个随机选择的案例。假如你选择了一个具体的行动方针,却被敌人发现了你的打算,他就能选择对你最不利的行动方针。你希望让他大吃一惊;最稳妥的办法就是让你自己大吃一惊。你应该留出尽可能长的时间考虑各种可能的方案,直到最后一刻才通过一种不可预测的从而也是不可侦察的方法做出你的选择。这个方法包含的相对比例应该符合这样的要求:敌人就算发现了这个比例,也不能以此占据上风。不过,这其实就是我们前面已经讲过的最佳混合策略。
最后给你一个警告。即便在你采用了自己的最佳混合策略的时候,你还是有可能得到相当糟糕的结果。即便棒球投手戴夫·
史密斯真的不可预测,有时候莱恩·
戴克斯特拉还是可以碰巧猜中他会投什么球,将球击出
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!