书城励志20几岁学点博弈论(每天学一点时尚阅读书系列)
24869700000035

第35章 警察与小偷博弈:乱拳打死老师傅,别按套路出牌(1)

你的行踪我已经识破,我的底牌你却总猜不出来。这种故弄玄虚的烟幕背后隐藏着“警察与小偷博弈”的策略,我看破你的诡计,因为你做出的都是纯策略,我只要按照你的策略制定出最优于我的策略就有足够的胜算。

在不利于我方的形势下应该怎么办?那就让别人去猜吧。把双方带入混合策略的均衡中,我方随机打出一张牌,虚虚实实、真真假假,让对方摸不着头脑。待我方摸清了对方的底细后,就可以出其不意地吃掉对方。

不能说出口的秘密

《三国演义》中记载,赤壁之战前,诸葛亮算定了曹操必然败走华容道,而且他夜观天象,认为曹操还不应该死。他考虑到曹操和关羽之间纠缠不清的瓜葛,于是就有意派关羽留守华容道,准备把这个人情留给关羽。

且说曹操兵败赤壁后,果真从华容道落荒而逃。途中经过一片险要之地时,曹操大笑。诸将疑惑不解,问是何故。曹操说:“我笑的不是别人,而是周瑜和诸葛亮缺少智谋。如果我指挥兵士定会在此埋伏,这样的话敌人就无可奈何了。”话音刚落,就跳出了一员大将赵子龙,惊得曹操差点掉下马来。徐晃、张郃奋力上前迎战,拦住了赵子龙,曹操才得以全身离去。

曹操落魄地逃到葫芦口处又放声大笑,众将再次疑惑。曹操说:“如果是我用兵指挥,就在这个地方也埋伏一路兵马以逸待劳,这样我们纵然能够全身而退,也一定会受到重伤。”正说到此,前方就跳出蜀军的一员大将张飞,正挡住了曹军的退路。多亏张辽、徐晃奋力保护,曹操才能再次脱险。

来到岔路口,军士禀报前面路况:一方是大路,地势平坦却比较远;一方是华容道,地窄、路险却比较近。曹操派人远观,发现小路上有数处小烟升起,大路却异常平静,多疑之下选择走小路,并夸口道这是虚虚实实的战术。就这样,行进不到数里,曹操第三次大笑于马上。众将疑惑地请教他大笑的原因,曹操说道:“周瑜和诸葛亮毕竟是无能之辈啊,若是他们在这个地方伏击我,我只好束手就擒了。”话音刚落,两边蹿出500校刀手,为首者正是关羽。这下曹军全都吓得魂飞魄散,曹操也马上哭了起来,请求关羽念在昔日情分上放了他。关羽果然不忍,放走了曹操。

曹操败走后的种种选择似乎全在诸葛亮的预料之中,而曹操每次于紧要关头总是自鸣得意,以此满足一下自己的虚荣心。双方之间无形的较量就如同一场博弈,不仅有战术上的也有心理上的,而策略上真真假假的运用更是让人摸不着头脑,曹操三笑三惊也让人忍俊不禁。这段文字虽然可能是杜撰的,有意夸大了诸葛亮的聪明才智,但是从中我们却可以看到一种特殊的博弈模型,这个博弈就是“警察和小偷的博弈”。

一家小镇上只有一名警察,他负责整个城镇的治安。而这个城镇有一家酒馆和一家银行,另外还有一个小偷。这个小偷被酒馆和银行的财富所吸引,总是想办法去偷盗,但是他又害怕被警察逮捕,所以总会想办法避开他。警察一心维护小镇的秩序和治安,所以他一心预防这个小偷的偷盗。这样,两人之间便形成了一场博弈。

但是两人每次都只能去一个地方,因此,如果警察选择小偷偷盗的地方巡逻就能抓捕到小偷;如果小偷选择警察没有巡逻的地方就可以偷盗成功。如果说银行的财产价值10万元,酒馆的财产价值5万元,那么警察应该如何选择巡逻方式才能最有效地预防小偷的偷盗呢?

对这道题的答案,很多人会无形中选择这样一种最简单的做法:警察对银行进行巡逻保护。原因很简单,因为银行的财物最值钱,这样,警察就可以保护大的利益不受损失,但如果这样,小偷去偷盗酒馆就一定会成功。这种做法对警察来说并不是最好的策略选择。对这个问题的解答,我们可以通过博弈论的知识对双方博弈中采用的策略加以分析和改进,从而找到最优策略。

因为银行的财产价值要比酒馆的高,因此,银行就成为警察重点保护的对象,但是也不能因此放弃对酒馆的保护。所以最好的一种策略就是随机策略。也就是说可以设置1、2、3三种标签,然后进行抽签。1、2号标签代表银行,3号标签代表酒馆,这样警察就有2/3的几率去银行,有1/3的几率去酒馆。同样,小偷针对警察的最优策略则是:同样抽签选择,但是1、2号标签代表酒馆,3号标签代表银行,这样就能获得较小的利润、较大的成功。小偷会有1/3的几率去银行,2/3的几率去酒馆。

小偷和警察之间这种混合策略的思路都是在理想的基础上制定的。也就是说,并不存在纯策略均衡。因为无论去银行还是去酒馆对双方来说都是随机的,对方都不知道自己的策略甚至策略的倾向性。要知道,一旦对方知道你策略的倾向性也就预示着你失败的可能性会增大。所以,小偷绝对不会让警察知道自己会有2/3的几率去酒馆,同样警察也不会这么做,因此,在双方未知的混合策略模式下,警察和小偷的策略对自身而言都是最优策略,可以达到纳什均衡。

生活中最常见的一种混合策略样板就是猜硬币。比如遇到一件头疼的事情,不知道是否应该去执行,此时就会通过扔硬币的方式来替自己决定自己的意愿。由于硬币落下的正反面都是随机的,几率都是1/2,因此硬币的正面还是反面决定的最终执行意愿:去还是不去,同样也都是1/2的几率。这就是博弈总的混合策略的纳什均衡。

再来回顾一下曹操败走华容道的故事,我们就可以看出他失败的原因和诸葛亮预料先机的原因都在于曹操的纯策略性。所谓“纯策略性”就是博弈的参与者在自己的策略空间中所做出的唯一确定的策略,是参与者一次性选取并且一直坚持的策略。而混合策略则不同,它是在各种备选策略中采取随机方式选取的,并且随机改变,使之成为一种难确定概率的策略。对曹操而言,选择一种最优于自己的策略就显示出了一种纯策略的均衡,而对诸葛亮而言,他当然知道曹操会做出这样一种最有利于自己的策略选择。因此,这种最优的策略决策反而成为曹操的劣势策略。实际上,在曹操和诸葛亮的博弈中,要想达到一种混合策略的均衡是很困难的,因为双方都在考量对方的心理,都更倾向于选择有利于自己的最优策略,同样也会考虑到对方会知道自己选择最优策略。因此,在曹操和诸葛亮的这场博弈中,曹操在博弈策略上早就已经输掉了。

在这场看似混合策略均衡的博弈中,每个人并不会真正做到混合策略的均衡,因此导致了纯策略的均衡,并最终形成零和博弈。一方的胜利必然伴随着另一方的失败,在这场较量中,只有紧闭自己的嘴巴才能保证维持混合策略均衡,从而分析出最有利于自己的纯策略均衡。这正如曹操在选择最有利于自己的纯策略时,早已经成为诸葛亮策略分析的一部分,但是曹操却并不知道这一点,这就是诸葛亮神秘莫测、奥妙高深的秘密所在。

不按套路出牌的有效策略

在“警察和小偷的博弈”中,混合策略的选择是一种最优的策略,而任何一种纯策略的均衡都会导致一方的失败。但是在运用中,这种看似随机选取的策略并不是真的被应用于赌博的方式,因为大部分高明的策略家都会倾向于在表面上看似运用混合策略进行博弈,实际上仍是在暗中选取一种最有利于自身的纯策略进行博弈。这种不按套路出牌的方式常让人摸不着头脑,因此对方也就不知道如何应对。

公元前628年,被烛之武说服而退兵的秦穆公听说郑国要和晋国交好,因此认为郑国在欺骗他,于是秦国决定趁晋国国君去世,国内忙乱,无暇顾及郑国之时,与留在郑国守北门的3个秦将里应外合,率300辆兵车偷袭郑国。

秦国偷袭郑国的消息被一个叫弦高的牛贩子得知,他非常担心郑国的安危。但此时报告郑穆公做好防御准备已经来不及了,他必须想一个两全的方法阻止秦军。

于是弦高一面派人把消息报告郑穆公,一面挑选了12头肥牛和4张熟牛皮,穿着官服,乘着马车,带着随从,守候在秦军的必经之路上。不久秦军浩浩荡荡开了过来,行至眼前时,弦高上前拦住去路,并拱手作揖道:“我是郑国的使臣,受郑穆公之命专程慰劳秦军将士。特此求见孟将军。”

秦国将军正是孟明,听说有使臣求见非常震惊。心想,这次偷袭计划是一次绝密行动,郑国怎么会知道?而且还这么远派使臣前来相迎,看来是有人走漏了风声。但是孟将军还是故作镇定地下马接见这个“使臣”。

当然,弦高也非常紧张,但他故作镇静地说:“听说秦国要去郑国,不知道是路过还是帮助郑国部署防务?郑国国土虽然狭小,但将士却个个本领非凡,而且日夜轮班时刻守卫着每寸土地,如果有外敌入侵,郑国肯定能把他们驱逐出境。如果秦军是来帮助郑国搞防务的,那就不用了。为了表达谢意,郑穆公特意派我为使臣,带来了12头肥牛和4张牛皮以犒劳秦军。请将军笑纳。”

孟将军听出了弦高的弦外之音,知道郑国不但得知秦国的偷袭计划,还做好了防御准备,使臣前来只是先礼后兵。因此,他推说自己只是路过,又推掉了弦高的犒劳,请弦高代向郑穆公致谢,绕道攻占了滑国(今河南境内),就率军回国了。

郑穆公得知弦高用计说退了秦军,如释重负,立即派人向3个守北门的秦将说:“你们整装待发,想必是要回国吧。郑穆公已经知道这件事,特派我等来告知,你们离家两年了,思乡回国是人之常情,那就请便吧。”等候秦军良久的3个秦将得知秦军已退,事情已败露,只好连夜率军奔回秦国。而弦高也被郑穆公大加赞赏,被破格封为军尉。

“真真假假,假假真真”,这种不按套路出牌的策略常常让敌人不知个中奥秘,因此也无法制定出应对的策略。弦高的假犒劳其实是一虚招,表面是犒劳秦军的“好意”,实则是迷惑敌人,让秦军读出错误的信息,并借机拖延时间;如果能借此招让秦军退兵当然是最好不过的。当然这种策略的选择只是私有信息,对方并不知道。因此从秦军的角度来看,他们不知道这个使臣是真是假,错误的信息让他们做出了错误的策略分析。最终,秦军在这场博弈中选择了放弃。弦高制造的这种看似混合策略博弈的背后,其实是一种纯策略的博弈。这种不按套路出牌的方式有效地挫败了敌人的心理,但是如果这种策略接连使用就肯定不会生效,反而会成为自己的致命伤。因此,只有让对手看不出真相,虚晃一招才是最厉害的杀招。

约翰·查理斯·哈萨尼认为,每一种博弈形式都会受到一些微小的随机波动因素的影响。在标准的博弈模型中,这些影响则表现为微小的独立而连续的随机变量,居中的每个人所采用的每一种策略均对应一个。这些随机变量的具体数值只有相关的局中人才知道,这种知识就是“私有信息”;而联合分布则是博弈者的共有信息。哈萨尼称之为“变动收益博弈”。

这个博弈理论适用于不完全信息博弈中,当随机变量趋于0时,“变动收益博弈”的纯策略均衡点则转化为随机混合策略的均衡点。换句话说,博弈中的人表面上是以混合策略进行博弈,实际上仍然是在各种略有不同的博弈形式中采用纯策略博弈。

西汉时期,北方的匈奴部落势力日渐强大,不断骚扰中原的边境。飞将军李广被委任为上郡太守,抵抗匈奴。

有一天,皇上派去上郡的宦官在外出打猎时受到了3名匈奴人的袭击。宦官受伤逃回来,李广见此情形大怒,亲自率领100名轻骑小部队追击这3名匈奴人,一直追了几十里才追上他们。李广的小部队杀了2名匈奴人,活捉了1名,正准备回营地时不巧撞到了有数千名匈奴骑兵的大部队。匈奴部队也看到了李广的小部队,但是担心李广的这批小部队是诱敌的前锋,不敢贸然进攻,于是跑到山上摆开阵势,观察对方的动静。

李广的小部队非常恐慌,李广却沉着地说:“我们现在只有百余骑兵,离我们的大营有几十里。如果我们逃跑肯定会遭到匈奴人的追杀;如果我们按兵不动,敌人肯定疑心我们有大部队接应,所以不敢贸然进攻。现在我们继续前进。”到了离敌人阵地只有2里地远的地方,李广下令全体休息,并让所有骑兵都悠闲地躺在草地上,看着马匹在一旁津津有味地吃草。

匈奴大部队看到此景十分惊奇,派了一名军官前去探听虚实。李广见此,骑马迎了上去,一箭射死了这名军官,然后又回到草地休息。这下匈奴人慌乱了,他们料定李广是胸有成竹,附近肯定有伏兵。天黑以后,李广的人马仍然没有动静,匈奴人也怕遭到大部队的突袭,慌忙逃离了。就这样,李广的百名骑兵安全返回了大营。

双方的博弈是一场生死较量,只有沉得住气才能保证奇招见效。要让这场博弈看似是一场混合策略的博弈就要保证对方获得的信息是不正确的,从而才能保证自己的优势,进而采取最优于自己的纯策略博弈方式。之所以说不按套路出牌的奇招能够见效,就在于在这种博弈形势下双方的信息不均等,从而使博弈的形势有利于己方,这样才能采取最有利于自己的纯策略。