任何带有选择性的博弈都有优势、劣势可言,所以,做“棋手”的我们在决策之前必须经过慎重的考虑,确切地估算出“成本”。如果先出手,利大于弊,就值得先发制人;如果得不偿失,或是得失相抵,那么就不值得做这种“吃力不讨好”的事情,还不如保本做个跟随者。
那么,怎样做到该出手时就出手呢?当自己处于不利地位时,不妨冒险去换取一张有利的底牌;当自己处于有利地位时,最好采用保守策略,跟着对方出牌,这样就会确保万无一失,稳坐“钓鱼台”。多劳未必多得
猪圈中有两只猪,一只比较大,一只比较小。猪圈的一端是按钮,另一端是饲料的出口和食槽。按一下控制猪食的按钮,就会有10份猪食进槽。如果小猪去按这个按钮,然后再跑回来吃食,只能吃到1份猪食,因为其余9份猪食早已被大猪吃掉;如果让大猪去按这个按钮,小猪就可以先吃到4份猪食,而大猪跑回来,则可以吃到其余6份猪食;如果大小猪一起去按这个按钮,然后再奔回来同时吃,大猪可吃到7份猪食,而小猪可以吃到3份猪食。
如果按照以上3种情况来讲,无论大猪采取何种策略,小猪的最佳选择都是等待,然后就可以坐享其成。如果小猪总是选择等待,那么,无奈的大猪就只好去按这个按钮。
这种策略组合就是闻名遐迩的“纳什均衡”,即限定一方采取某种既定的策略(即小猪按兵不动),另一方所采取的最佳策略(即大猪按按钮)。它指的是,在给定一方采取某种策略的条件下,另一方所采取的最佳策略。
“圈中猪”博弈的具体情况如下:
如果两只猪同时跑去按按钮,然后再同时向食槽跑回去,大猪可以吃7份猪食,得益5分,小猪吃3份,得益1分;如果小猪等待大猪去按按钮,小猪可以吃4份,得益4份,大猪可以吃6份,付出2分,得益4分;如果小猪去按按钮,大猪就可以吃9份,得益9分,小猪可以吃进1份,付出2分,实得-1分;如果双方都懒得动,那么,大小猪所得都将为0。
通过以上3组数据的分析,我们就可以获知“等待”是小猪的最佳策划选择,而“按按钮”是小猪的劣势策略。如果忽略不计小猪的劣势策略,只看大猪的表现,由于小猪已经选定了“等待”优势策略,那么,现在只剩下大猪去做选择了,结果不外乎有两种:一是1分不得;二是去按按钮,得4份猪食。自然,“等待”就成为大猪的劣势策略。
那么,这个博弈中的均衡解是什么呢?大猪选择去按按钮,小猪坐享其成地等待,这样小猪就可以先吃,而且还可以多吃。这是一种“多劳不多得,少劳不少得”的均衡。
为什么会出现这种不均衡的情况呢?通过分析我们可以获知,小猪不按按钮相对于按按钮是一种上上策略,它不按按钮可能会出现两种结果:第一,大猪去按,小猪可以坐享其成;第二,小猪、大猪都不按动,两者最终干耗着饿死(跟小猪去按按钮一样,但是不至于被很快饿死,因为身体当中还保存着一些能量)。
换位思考,现在我们来看看大猪的哪种策略才是上策。相对于小猪而言,大猪按按钮也是上策,但是,如果大猪知道小猪的意志是十分坚定的,根本不会理会大猪的死活,那么是不是大猪也闭目养神,听之任之,不是等着天上掉馅饼,就是坐着喝西北风呢?
当然不会是这样,原因有两点:一是,大猪需要更多能量补充体力,与小猪相比,它根本耗不起;二是,姜还是老的辣,大猪也不笨,它深知小猪的想法,因此也会适时地调整策略,不会弄成两只猪都没东西吃的局面。所以,大猪的决策还是去按按钮,这样多少还是会有一些收益的,即使那是残羹冷炙,也好于两者都被饿死。因此,大猪最好的策略就是亲自按按钮,而不是将希望寄托在他人身上。
上述智猪博弈的均衡解是如何得出的?其实,我们只要按照“重复剔除严格劣势策略”的思路就可以推理得出,这个思路可以简化为:首先,找到对方的严格劣势策略,然后将它删除,重新构建一个不包括已经删除策略的新博弈,然后继续删除新博弈中的劣势策略,重复进行这一过程,直到剩下最后也是唯一的策略为止。剩下这个唯一的策略,也就是博弈的均衡解,即称之为“重复剔除的占有策略均衡”。
也就是说,无论大猪做何选择,小猪选择“按兵不动”都是最明智的,按按钮对小猪而言是一个严格劣势策略,所以,首先应该剔除它。在剔除按按钮这一劣势选项之后,在新的博弈中,小猪只有选择“等待”,这回就轮到大猪作选择了,此时,大猪有两个策略可供参考,“等待”对大猪来讲是一个严格劣势策略,所以,我们将“等待”策略剔除,这样在新的一轮博弈中,只剩下大猪按按钮,小猪等待的策略可供选择,这就是智猪博弈的最后均衡解,达到重复剔除的优势策略均衡。
与囚徒困境不同的是,智猪博弈当中,只有小猪有最佳优势选择,而大猪则没有。在所有博弈当中,如果每位参与者都有严格的优势策略,那么,严格优势策略则是合乎情理和逻辑的。但是,在现实生活中,这种严格优势策略均衡的现象却是不容易出现的,而只存在重复剔除的优势策略均衡,所以,这种智猪博弈虽乍看起来有点滑稽,但是它却是根据优势策略的逻辑推理得出的博弈模型。
后发制人的策略
俗话说:“先下手为强,后下手遭殃。”的确,生活中大量的例子都能说明这一道理,在多个“纳什均衡”的情况下,常常都是先动手、先决策的一方占据优势地位,但是也排除个别特例的出现。
《孙子兵法》中讲:“凡先处战地而待敌者佚,后处战地而趋战者劳。故善战者,致人而不致于人。”先人一步下手确实有其好处,但是这种占据性的优势如果无法转化为最后的胜利,还可能招致腹背受敌,给对方以可乘之机,就像运动场上的领跑者,即使一出场占据了第一位,但等到最后冲刺时,第一个冲过终点线的往往是保存实力的后者。
现在我们来总结一下后动优势的经典案例,看过以下两个案例之后,你就会对后动优势策略有更深刻的认识和了解。
案例一:帆船比赛
1983年的美洲杯帆船赛的前4轮决赛已经结束了,丹尼斯·康纳的“自由女神号”暂时以3胜1负的成绩遥遥领先。这是7轮4胜的比赛,第5轮的比赛即将拉开帷幕。
比赛伊始,由于“澳大利亚二号”过度激动,抢在发令枪声之前出发,所以只好重新回到起点线后面再次起步,这样就使“自由女神号”在这一轮的比赛中获得了37秒的领先优势,此时,落后的澳大利亚队的船长约翰·伯特兰德决定“釜底抽薪”,转到赛道左边,希望借助风向改变他们落后的局面。
丹尼斯·康纳则决定将“自由女神号”留在赛道右边。伯特兰德大胆地改变赛道,而且“天公”又很作美,风向确实如愿偏转了5度,这样一来,就使得澳大利亚队以1分47秒的巨大优势赢得了这场比赛。比赛结束之后,众人纷纷评论说康纳的策略很失败,没能跟随澳大利亚队调整航向,以致“澳大利亚二号”反超成功,最终以43赢得了决赛的桂冠。
在赛场上,成绩起初优先不算什么,也是没有用处的,只有能够最终胜出才算数。
如果双方能力、技术以及实力相当,那么,帆船比赛的输赢在很大程度上取决于赛场上的风向。就拿1983年那场帆船比赛来讲,在美国人以3∶1的场数领先,又占据了37秒的优势时,他们就获得了后动优势,澳大利亚队押什么风向,他们就应该押相同的风向,这样就可以做到万无一失,因为即使澳大利亚队押对了,美国队也不会有什么大的损失,至多会因为决策晚一点输掉几秒而已,最糟糕的情况也不至于会将37秒统统输光;同理,如果澳大利亚队押错了,那么,大家都错了,这至关重要的37秒的优势依然存在。
案例二:
巴里是《策略思维》的作者之一,他大学毕业时参加了剑桥大学的5月舞会——这是大学的正式舞会。舞会上有多种多样的游戏,其中包括在赌场下注。
舞会开始时,每位参加者都将得到相当于20美元的筹码,舞会结束时,将统计个人手中的筹码,收获最高的一人将免费获得下一年舞会的两张入场券。最后一项游戏是轮盘赌,由于机缘巧合或是个人运气,巴里手中已经积聚了700美元的筹码,此时的他独占鳌头。排名第二的是一个英国女孩,她手中拥有300美元的筹码,此时,其他参加者都已经被淘汰出局。在最后一次下赌注之前,那个女孩提出分享下一年舞会的入场券,但是巴里拒绝了,他想自己占据这么大的优势,怎么能将到手的“战果”与他人平分呢?
为了帮助大家更好地理解这个游戏的行动策略,我们先简单地介绍一下轮盘赌的规矩,它的输赢取决于轮盘停止转动时小球落在的位置。轮盘上一般刻有0~36共37个小格子,假如小球落在0处,则意味着庄家输。轮盘赌最常见的玩法在于赌“小球落在偶数还是奇数上(分别用红色和黑色代表)”。
这种玩法的输赢是一赔一,比如1元赌注变2元,2元变4元,依此类推,不过它取胜的机会只有18/37。在敌众我寡的情况下,即使英国女孩将自己300美元的筹码全部押上,也不可能保证稳赚不赔,所以,女孩被迫选择了一种风险更大的玩法,她把全部赌注都押在小球能够落在3的倍数上,这种玩法的赔率是二赔一,如果英国女孩赢了,她将获得900美元,但是取胜的几率只有12/37,计算下来还不到1/3。
风险与收益向来是均等的,现在女孩已经将自己的赌注放到了桌面上,这就证明她已经下注了,这是不能更改的,即使反悔也是毫无意义的。
此时,所有的目光都集中到了巴里身上,他应该怎么办呢?通过帆船比赛我们知道,此时巴里应该模仿这位女生的做法,将300美元押在3的倍数上,这样做,可以确保他领先对手400美元,最终赢得那两张入场券,即如果双方都输了,巴里可以以4000的优势取胜;假如双方都赢了,巴里也将以1300900取胜,这样一来,这名女孩根本没有任何其他的机会获胜。即使这一轮她不赌了,也不会有任何机会获胜,因为女孩退出,巴里也同样会退出,这样他将不会有任何损失,照样全胜。
女孩唯一反败为胜的机会就是寄希望于巴里先下注,如果巴里在黑色之处下注300美元,那么,女孩应该怎么办呢?最聪明的做法是,女孩将自己300美元的赌注押在红色格子上。如果女孩将300美元的赌注全部押在黑色格子上,对她没有丝毫好处,只有巴里取胜,她才能够取胜。即使双方都赢了,女孩以600美元的筹码,也只能排在亚军的位置上。
如果女孩取胜,巴里失败,女孩手中将剩下600美元的筹码,而巴里只剩下400美元,这才是她唯一转败为胜的机会和希望之所在,所以,综上所述,女孩只能将赌注下在与巴里相对应的颜色之上,即红色上。
由此可见,如果巴里先下注,女孩就有机会转败为胜,相反,如果女孩先下注,巴里就可以选择确保万无一失的行动策略,其实这种策略何止存于轮盘赌之中,在许多博弈游戏里,抢占先机、率先出手并不总是好事。
常言道“树大招风”,过度地展现自己难免会将自身的意图公之于众,而其他的参与者就可以从中看到破绽,利用这一点攻击你。这种“后发制人”的策略可以使一个人处于更有利的地位上,而且对手无从知晓他将采用何种行动策略。这是毋庸置疑的制胜法宝。
那么上面案例的结果又如何呢?当时已经是凌晨3点左右了,那时的巴里已经喝下了太多的香槟,再也无法保持头脑清醒,结果他把200美元押在偶数上,暗自盘算“输掉两张入场券的唯一可能性就是这一轮自己输了,而英国女孩赢了”。但是转念一想,这样的几率只有1/5,所以,巴里想局势对自己还是很有利的。
也许,巴里一方面想,自己的经济学已经学得炉火纯青了,很向往“无招胜有招”的境界,于是,他漠视了已经取得的后动优势;另一方面,他已经算出了自己输给女孩的几率只有1/5。没有人敢保证这20%的几率永远不出现。但出乎意料的是,女孩赢得了那两张下一年度的舞会入场券,巴里功败垂成。
值得注意的是,上述两个“模仿策略”实施的后动优势的适用范围只是“赢者通吃”的比赛。如果不是这样的比赛,而是积分类型的比赛,情况就大相径庭了。