陷入囚徒困境的两个人,忠于协议和相互背叛哪个更为优势策略?面对困境,如何共同努力走出来,实现双赢?如何巧妙利用困境,解决棘手的难题?如何制造困境,降低商业的成本?在面对困境时,你应该注意哪些问题?在这一章中,针对这些问题,你将会找到满意的答案。
“囚徒困境”
1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,他用两个囚犯的故事,将当时专家们正研究的一类博弈论问题,作了形象化的解释。从此以后类似的博弈问题便有了一个专门名称——“囚徒困境”。
借着这个故事和名称,“囚徒困境”广为人知,在哲学、伦理学、社会学、政治学、经济学乃至生物学等学科中,获得了极为广泛的应用。
所谓的“囚徒困境”,大意是这个样子的:
甲、乙两个人一起携枪准备作案,被警察发现抓了起来。警方怀疑,这两个人可能还犯有其他重罪,但没有证据。于是分别进行审讯,为了分化瓦解对方,警方告诉他们,如果主动坦白,可以减轻处罚;顽抗到底,一旦同伙招供,你就要受到严惩。当然,如果两人都坦白,那么所谓“主动交代”也就不那么值钱了,在这种情况下,两人还是要受到严惩,只不过比一人顽抗到底要轻一些。在这种情形下,两个囚犯都可以作出自己的选择:或者供出他的同伙,即与警察合作,从而背叛他的同伙;或者保持沉默,也就是与他的同伙合作,而不是与警察合作。这样就会出现以下几种情况(为了更清楚地说明问题,我们给每种情况设定具体刑期):
如果两人都不坦白,警察会以非法携带枪支罪而将两人各判刑1年;
如果其中一人招供而另一人不招,坦白者作为证人将不会被起诉,另一人将会被重判15年;
如果两人都招供,则两人都会因罪名各判10年。
这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果——只判刑1年。但他们不得不仔细考虑对方可能采取什么选择。问题就这样开始了,甲、乙两个人都十分精明,而且都只关心减少自己的刑期,并不在乎对方被判多少年(人都是有私心的嘛)。
甲会这样推理:假如乙不招,我只要一招供,马上可以获得自由,而不招却要坐牢1年,显然招比不招好;假如乙招了,我若不招,则要坐牢15年,招了只坐10年,显然还是以招认为好。无论乙招与不招,我的最佳选择都是招认。还是招了吧。
自然,乙也同样精明,也会如此推理。
于是两人都作出招供的选择,这对他们个人来说都是最佳的,即最符合他们个体理性的选择。照博弈论的说法,这是本问题的唯一平衡点。只有在这一点上,任何一人单方面改变选择,他只会得到较差的结果。而在别的点,比如两人都拒认的场合,都有一人可以通过单方面改变选择,来减少自己的刑期。
也就是说,对方背叛,你也背叛将会更好些。这意味着,无论对方如何行动,如果你认为对方将合作,你背叛能得到更多;如果你认为对方将背叛,你背叛也能得到更多。你背叛总是好的。这是一个有些让人寒心的结论。
为什么聪明的囚犯,却无法得到最好的结果?两个人都招供,对两个人而言并不是集体最优的选择。无论对哪个人来说,两个人都不招供,要比两个人都招供好得多。
“囚徒困境”这个问题为我们探讨合作是怎样形成的,提供了极为形象的解说方式,产生不良结局的原因是因为两个囚犯都基于自私的角度开始考虑,这最终导致合作没有产生。
在这个游戏中,你将如何做呢?设想你认为对方将合作,你可以选合作,那么你将得到“对双方合作的奖励”。当然,你也可以选背叛,得到“对双方背叛的惩罚”。
换言之,如果你认为对方合作,那么你背叛将能得到更多的好处。反过来,如果你认为对方将背叛,那么你也有两个选择,你选择合作,那么你就是“笨蛋”;你选择背叛,就会得到“对双方背叛的惩罚”。因此,对方背叛,你也背叛将会更好些。这就是说,无论对方如何行动,你背叛总是好的。到现在为止,你似乎知道该怎样做;但是,要知道相同的逻辑对另一个人也同样适用。
因此,另一个人也将背叛而不管你如何做。这样,你们将是双方背叛,只能一起坐牢很久,这比你们双方合作所能得到的“奖励”(只需短期服刑)差很多。个体的理性导致双方得到的比可能得到的少,这就是“困境”。
启示1:在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。独立于对方所用策略之外的最好决策规则是不存在的。
启示2:“囚徒困境”是一些非常普遍而有趣的情形的简单抽象。在这些情形中,从个人的角度来说,背叛是最好的选择,但双方背叛会导致不甚理想的结果出现。
在生活中,不乏有很多囚徒博弈的例子。比如有这样一个经典的故事:
两个旅行者麦克和约翰从一个以出产瓷器的著名旅游胜地回来时,他们各买了一个瓷花瓶。提取行李时,发现花瓶被碰破了。他们向航空公司索赔。
航空公司估计花瓶的价格在80~90元之间,但不知道这两位旅客购买的准确价格。航空公司要求两位旅客在100元以内自己写下花瓶价格。若两人所写的相同,说明他们说了真话,就照他们写的数额赔偿;如果两人所写的不一样,那就认定写得低的旅客讲的是真话,按这个低的价格赔偿,但是对讲真话的旅客奖励2元钱,对讲假话的旅客罚款2元。
如果两人都写100元,他们都会获得100元。但是,给定约翰写100元,麦克改写99元,则他会获得101元。约翰又想,若麦克写99元,他自己写98元,比写100元好,因为这样他获100元,而自己写100元,当麦克写99元时自己却只获97元。而给定约翰写98元,麦克又会写97元……这样,最后落得两个人只写1元的境地。
双输,这就是囚徒困境往往带来的结果。
再有,一个小镇政府有一个为期1年的采购计划,每个月采购一批饮料。如果小镇上的两家饮料公司的报价一致,那么政府就把订单一分为二。否则,政府会把更多的订单给报价低的那个公司。显然,这两家公司都报出同样的高价,才符合其利益。在这种多次博弈中,他们会联合起来出高价吗?如果会,那么在1年12次的博弈中他们会合作几次呢?
假如他们开始签订了合约,都报出一个比较高的价位。不过,显然最后一次他们不需要遵守合约,因为反正以后没有采购计划了,违约也不会有什么坏处。如果是这样,倒数第二次也不需要遵守合约,因为不论怎样倒数第一次都是要违约的,那就不存在是否有惩罚的问题。所以倒推下来,一次合约都不用遵守。两家公司最后可能还是两败俱伤。
如果你有兴趣,还可以做一个实验:选定几个人,让他们都猜一个数字,必须是1或100之间的整数。条件是谁最接近所有实验者的所猜数字平均值的1/3,谁就可以得到100块钱。
这个时候,每个人都会想:如果一开始其他人都是随机地选择数字,50就会是所有人的猜测。这个时候,猜50的1/3也就是大约17可能会赢。然而,每个人都会猜到17这个数字的时候,大家就会猜测17的1/3,也就是6左右。依次类推,这个游戏中的每一个人最终猜测的结果是唯一最小的数字,那就是1。
囚徒困境反映了个人理性和集体理性的矛盾。如果甲和乙都选择抵赖,各判刑1年,显然比都选择坦白各判刑10年好得多。当然,甲和乙可以在被警察抓到之前订立一个“攻守同盟”,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。
因为这种协商,并不会影响他们在被审讯的时候所作的决策。虽然有了协议,但乙还是不敢确信甲是否会出卖自己,并且不论甲是否背叛协约,出卖对方肯定是有好处的。反过来甲是这么想的,所以到最后他俩还是会同时出卖对方。
巧降商业成本
由于囚徒双方都是从自己的利益去考虑,很多时候采取出卖对方的策略,结果被主导者(囚徒困境中的警察角色)所利用,让双方陷入了困境,可以起到降低成本的作用。
比如现在有一个政府项目,是公开招标选择网络公司建立政府网,某公司是投标者之一。对于这个公司来说,根据过去的经验能够预算出接手这个项目的真实成本是100万元人民币,然而这个公司并不了解其他竞争对手的真实成本。
该公司根据市场行情推断,其他公司的真实成本在50万~150万元之间。从概率的角度去看,在50万~150元万之间的任何一个价格都有可能是最终的胜利者。我们简化这个问题,假设每个公司的成本只能是50万~60万元、60万~70万元……120万~130万元、130万~140万元、140万~150万元这样的整数,总共有10种可能,因此最终获得胜利的公司落在这10种价格区间中的任何一个的概率是1/10。
如果这个公司报价90万元,很显然,公司即使胜出,仍然要亏本10万元,看来100万元的报价是底线,低于这个价格的报价对于该公司毫无意义。当然这只是这一机制的理想状况。实际当中,如果价格低于成本,破坏了市场均衡,毫无疑问会影响项目质量,不但损害中标者利益,最终还会损害招标政府自身利益。
自然从理论上说,该公司投标报价一定要高于100万元,不妨假设报价为120万元,根据这10种价格的概率,其他公司报价低于120万元该公司失败的概率是3/5,即使开价100万,该公司不能中标的概率也有2/5。当然开价120万元胜出时可以赚取20万元利润,而开价100万元时,即使胜出也仅仅是能够弥补成本而已。
由此可见,开出一个较高的价码是该公司的优势策略。每一个投标公司都这么考虑的话,所有公司的报价都会高于实际成本,结果就是所有的开价都被人为抬高。怎样才能让公司投标报价接近于真实成本呢?
问题的关键在于采用某种激励机制来驱动投标者不说谎。如有这样一种激励方式,就是将合同判给开价最低者,但是却让他付开价第二低者的价格。
这个时候该公司如果开出的还是120万元的报价并且是第二低的价码,而另一家公司开出的价格比这个公司要低,比如是低于该公司成本价的90万元,该公司最终的价格120万元反而成了这个胜出公司的最终项目价码。在这种招投标方式下,任何一个公司的优势策略就是开出一个接近其真实项目成本的价格。
按照博弈论的观点具体分析招投标行为我们还可以发现:就像博弈的参加者独立决策、独立承担后果那样,投标各方也如同分别隔离审问,不准串供,他们相当于处在“两难困境”中的“囚徒”,各家只能依据自身实力、期望利润和所掌握的市场信息,自主报价,独自承担风险。
不难看出,机制设计的关键是如何让每个公司的报价有利于集体选择,并最终达到“纳什均衡”。这里其实靠的是两个制度安排:
1.阻止公司之间的合作;
2.制定了一套“坦白从宽,抗拒从严”的赏罚规则。
由此可见,在招投标的机制设计中,通过博弈竞争使中标价接近成本价,达到均衡合理,为招标人节约投资,提高经济效益。通过优胜劣汰,使市场竞争力低下的投标人无力参与竞争而退出市场,让有实力的投标人脱颖而出,使资源达到均衡配置,市场秩序得以规范。
再有,假如你是一个事业部门的经理,手下有七八个业务员。有什么好办法让他们拼命干活呢?看完了上面的文字,你一定已经想到了一个好办法——让他们陷入囚徒困境。一旦每个员工都觉得,拼命工作,无条件地加班加点是自己的最优选择,老板的日子就舒心了。
让员工们陷入这种困境的方法很多。例如:
威逼——按员工业绩给他们打分评级,告诉他们,得分最差的扣工资;
利诱——得分最高的给奖金;
煽风点火——对小王说:“小王啊,你知道我们公司要提拔一批新的管理人员,我是很看好你的。不过你看老张,都拖家带口的了,最近还经常干到半夜,也在较着劲呢。你现在没有家庭负担,可不能比他落后了,这样我也好在老板那儿给你说好话。”然后对老张说:“你看人家小王,天天工作到半夜,才毕业没多久,业绩已经有声有色了。你可是老员工了,如果成绩还比不上新来的,让我怎么向老板推荐你啊?”
总之,这一套手段耍下来,如果运用得好,员工能都应该攀比着加班加点吧!
也不一定!尤其是如果你接管的部门成立已久,员工们都非常熟悉有一定交情的时候,这套手段就不那么灵验了。工资是按月领的,员工们在进行的是无法预期次数的多次博弈。有理性的员工很快就会发现,听老板的话只会让自己更辛苦。渐渐地他们就会达成默契,从囚徒困境中摆脱出来:原来什么样还是什么样,能偷懒就偷懒。奖金轮流拿;拿了奖金的要大出血,安抚住其他没拿到奖金的。