第9章囚徒困境巧抉择（1）

书签收藏评论目录封面

陷入囚徒困境的两个人，忠于协议和相互背叛哪个更为优势策略？面对困境，如何共同努力走出来，实现双赢？如何巧妙利用困境，解决棘手的难题？如何制造困境，降低商业的成本？在面对困境时，你应该注意哪些问题？在这一章中，针对这些问题，你将会找到满意的答案。

“囚徒困境”

1950年，数学家塔克任斯坦福大学客座教授，在给一些心理学家作讲演时，他用两个囚犯的故事，将当时专家们正研究的一类博弈论问题，作了形象化的解释。从此以后类似的博弈问题便有了一个专门名称——“囚徒困境”。

借着这个故事和名称，“囚徒困境”广为人知，在哲学、伦理学、社会学、政治学、经济学乃至生物学等学科中，获得了极为广泛的应用。

所谓的“囚徒困境”，大意是这个样子的：

甲、乙两个人一起携枪准备作案，被警察发现抓了起来。警方怀疑，这两个人可能还犯有其他重罪，但没有证据。于是分别进行审讯，为了分化瓦解对方，警方告诉他们，如果主动坦白，可以减轻处罚；顽抗到底，一旦同伙招供，你就要受到严惩。当然，如果两人都坦白，那么所谓“主动交代”也就不那么值钱了，在这种情况下，两人还是要受到严惩，只不过比一人顽抗到底要轻一些。在这种情形下，两个囚犯都可以作出自己的选择：或者供出他的同伙，即与警察合作，从而背叛他的同伙；或者保持沉默，也就是与他的同伙合作，而不是与警察合作。这样就会出现以下几种情况(为了更清楚地说明问题，我们给每种情况设定具体刑期)：

如果两人都不坦白，警察会以非法携带枪支罪而将两人各判刑1年；

如果其中一人招供而另一人不招，坦白者作为证人将不会被起诉，另一人将会被重判15年；

如果两人都招供，则两人都会因罪名各判10年。

这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果——只判刑1年。但他们不得不仔细考虑对方可能采取什么选择。问题就这样开始了，甲、乙两个人都十分精明，而且都只关心减少自己的刑期，并不在乎对方被判多少年(人都是有私心的嘛)。

甲会这样推理：假如乙不招，我只要一招供，马上可以获得自由，而不招却要坐牢1年，显然招比不招好；假如乙招了，我若不招，则要坐牢15年，招了只坐10年，显然还是以招认为好。无论乙招与不招，我的最佳选择都是招认。还是招了吧。

自然，乙也同样精明，也会如此推理。

于是两人都作出招供的选择，这对他们个人来说都是最佳的，即最符合他们个体理性的选择。照博弈论的说法，这是本问题的唯一平衡点。只有在这一点上，任何一人单方面改变选择，他只会得到较差的结果。而在别的点，比如两人都拒认的场合，都有一人可以通过单方面改变选择，来减少自己的刑期。

也就是说，对方背叛，你也背叛将会更好些。这意味着，无论对方如何行动，如果你认为对方将合作，你背叛能得到更多；如果你认为对方将背叛，你背叛也能得到更多。你背叛总是好的。这是一个有些让人寒心的结论。

为什么聪明的囚犯，却无法得到最好的结果？两个人都招供，对两个人而言并不是集体最优的选择。无论对哪个人来说，两个人都不招供，要比两个人都招供好得多。

“囚徒困境”这个问题为我们探讨合作是怎样形成的，提供了极为形象的解说方式，产生不良结局的原因是因为两个囚犯都基于自私的角度开始考虑，这最终导致合作没有产生。

在这个游戏中，你将如何做呢？设想你认为对方将合作，你可以选合作，那么你将得到“对双方合作的奖励”。当然，你也可以选背叛，得到“对双方背叛的惩罚”。

换言之，如果你认为对方合作，那么你背叛将能得到更多的好处。反过来，如果你认为对方将背叛，那么你也有两个选择，你选择合作，那么你就是“笨蛋”；你选择背叛，就会得到“对双方背叛的惩罚”。因此，对方背叛，你也背叛将会更好些。这就是说，无论对方如何行动，你背叛总是好的。到现在为止，你似乎知道该怎样做；但是，要知道相同的逻辑对另一个人也同样适用。

因此，另一个人也将背叛而不管你如何做。这样，你们将是双方背叛，只能一起坐牢很久，这比你们双方合作所能得到的“奖励”(只需短期服刑)差很多。个体的理性导致双方得到的比可能得到的少，这就是“困境”。

启示1：在“囚徒困境”中表现最好的策略直接取决于对方采用的策略，特别是取决于这个策略为发展双方合作留出多大的余地。独立于对方所用策略之外的最好决策规则是不存在的。

启示2：“囚徒困境”是一些非常普遍而有趣的情形的简单抽象。在这些情形中，从个人的角度来说，背叛是最好的选择，但双方背叛会导致不甚理想的结果出现。

在生活中，不乏有很多囚徒博弈的例子。比如有这样一个经典的故事：

两个旅行者麦克和约翰从一个以出产瓷器的著名旅游胜地回来时，他们各买了一个瓷花瓶。提取行李时，发现花瓶被碰破了。他们向航空公司索赔。

航空公司估计花瓶的价格在80～90元之间，但不知道这两位旅客购买的准确价格。航空公司要求两位旅客在100元以内自己写下花瓶价格。若两人所写的相同，说明他们说了真话，就照他们写的数额赔偿；如果两人所写的不一样，那就认定写得低的旅客讲的是真话，按这个低的价格赔偿，但是对讲真话的旅客奖励2元钱，对讲假话的旅客罚款2元。

如果两人都写100元，他们都会获得100元。但是，给定约翰写100元，麦克改写99元，则他会获得101元。约翰又想，若麦克写99元，他自己写98元，比写100元好，因为这样他获100元，而自己写100元，当麦克写99元时自己却只获97元。而给定约翰写98元，麦克又会写97元……这样，最后落得两个人只写1元的境地。

双输，这就是囚徒困境往往带来的结果。

再有，一个小镇政府有一个为期1年的采购计划，每个月采购一批饮料。如果小镇上的两家饮料公司的报价一致，那么政府就把订单一分为二。否则，政府会把更多的订单给报价低的那个公司。显然，这两家公司都报出同样的高价，才符合其利益。在这种多次博弈中，他们会联合起来出高价吗？如果会，那么在1年12次的博弈中他们会合作几次呢？

假如他们开始签订了合约，都报出一个比较高的价位。不过，显然最后一次他们不需要遵守合约，因为反正以后没有采购计划了，违约也不会有什么坏处。如果是这样，倒数第二次也不需要遵守合约，因为不论怎样倒数第一次都是要违约的，那就不存在是否有惩罚的问题。所以倒推下来，一次合约都不用遵守。两家公司最后可能还是两败俱伤。

如果你有兴趣，还可以做一个实验：选定几个人，让他们都猜一个数字，必须是1或100之间的整数。条件是谁最接近所有实验者的所猜数字平均值的1/3，谁就可以得到100块钱。

这个时候，每个人都会想：如果一开始其他人都是随机地选择数字，50就会是所有人的猜测。这个时候，猜50的1/3也就是大约17可能会赢。然而，每个人都会猜到17这个数字的时候，大家就会猜测17的1/3，也就是6左右。依次类推，这个游戏中的每一个人最终猜测的结果是唯一最小的数字，那就是1。

囚徒困境反映了个人理性和集体理性的矛盾。如果甲和乙都选择抵赖，各判刑1年，显然比都选择坦白各判刑10年好得多。当然，甲和乙可以在被警察抓到之前订立一个“攻守同盟”，但是这可能不会有用，因为它不构成纳什均衡，没有人有积极性遵守这个协定。

因为这种协商，并不会影响他们在被审讯的时候所作的决策。虽然有了协议，但乙还是不敢确信甲是否会出卖自己，并且不论甲是否背叛协约，出卖对方肯定是有好处的。反过来甲是这么想的，所以到最后他俩还是会同时出卖对方。

巧降商业成本

由于囚徒双方都是从自己的利益去考虑，很多时候采取出卖对方的策略，结果被主导者（囚徒困境中的警察角色）所利用，让双方陷入了困境，可以起到降低成本的作用。

比如现在有一个政府项目，是公开招标选择网络公司建立政府网，某公司是投标者之一。对于这个公司来说，根据过去的经验能够预算出接手这个项目的真实成本是100万元人民币，然而这个公司并不了解其他竞争对手的真实成本。

该公司根据市场行情推断，其他公司的真实成本在50万～150万元之间。从概率的角度去看，在50万～150元万之间的任何一个价格都有可能是最终的胜利者。我们简化这个问题，假设每个公司的成本只能是50万～60万元、60万～70万元……120万～130万元、130万～140万元、140万～150万元这样的整数，总共有10种可能，因此最终获得胜利的公司落在这10种价格区间中的任何一个的概率是1/10。

如果这个公司报价90万元，很显然，公司即使胜出，仍然要亏本10万元，看来100万元的报价是底线，低于这个价格的报价对于该公司毫无意义。当然这只是这一机制的理想状况。实际当中，如果价格低于成本，破坏了市场均衡，毫无疑问会影响项目质量，不但损害中标者利益，最终还会损害招标政府自身利益。

自然从理论上说，该公司投标报价一定要高于100万元，不妨假设报价为120万元，根据这10种价格的概率，其他公司报价低于120万元该公司失败的概率是3/5，即使开价100万，该公司不能中标的概率也有2/5。当然开价120万元胜出时可以赚取20万元利润，而开价100万元时，即使胜出也仅仅是能够弥补成本而已。

由此可见，开出一个较高的价码是该公司的优势策略。每一个投标公司都这么考虑的话，所有公司的报价都会高于实际成本，结果就是所有的开价都被人为抬高。怎样才能让公司投标报价接近于真实成本呢？

问题的关键在于采用某种激励机制来驱动投标者不说谎。如有这样一种激励方式，就是将合同判给开价最低者，但是却让他付开价第二低者的价格。

这个时候该公司如果开出的还是120万元的报价并且是第二低的价码，而另一家公司开出的价格比这个公司要低，比如是低于该公司成本价的90万元，该公司最终的价格120万元反而成了这个胜出公司的最终项目价码。在这种招投标方式下，任何一个公司的优势策略就是开出一个接近其真实项目成本的价格。

按照博弈论的观点具体分析招投标行为我们还可以发现：就像博弈的参加者独立决策、独立承担后果那样，投标各方也如同分别隔离审问，不准串供，他们相当于处在“两难困境”中的“囚徒”，各家只能依据自身实力、期望利润和所掌握的市场信息，自主报价，独自承担风险。

不难看出，机制设计的关键是如何让每个公司的报价有利于集体选择，并最终达到“纳什均衡”。这里其实靠的是两个制度安排：

1．阻止公司之间的合作；

2．制定了一套“坦白从宽，抗拒从严”的赏罚规则。

由此可见，在招投标的机制设计中，通过博弈竞争使中标价接近成本价，达到均衡合理，为招标人节约投资，提高经济效益。通过优胜劣汰，使市场竞争力低下的投标人无力参与竞争而退出市场，让有实力的投标人脱颖而出，使资源达到均衡配置，市场秩序得以规范。

再有，假如你是一个事业部门的经理，手下有七八个业务员。有什么好办法让他们拼命干活呢？看完了上面的文字，你一定已经想到了一个好办法——让他们陷入囚徒困境。一旦每个员工都觉得，拼命工作，无条件地加班加点是自己的最优选择，老板的日子就舒心了。

让员工们陷入这种困境的方法很多。例如：

威逼——按员工业绩给他们打分评级，告诉他们，得分最差的扣工资；

利诱——得分最高的给奖金；

煽风点火——对小王说：“小王啊，你知道我们公司要提拔一批新的管理人员，我是很看好你的。不过你看老张，都拖家带口的了，最近还经常干到半夜，也在较着劲呢。你现在没有家庭负担，可不能比他落后了，这样我也好在老板那儿给你说好话。”然后对老张说：“你看人家小王，天天工作到半夜，才毕业没多久，业绩已经有声有色了。你可是老员工了，如果成绩还比不上新来的，让我怎么向老板推荐你啊？”

总之，这一套手段耍下来，如果运用得好，员工能都应该攀比着加班加点吧！

也不一定！尤其是如果你接管的部门成立已久，员工们都非常熟悉有一定交情的时候，这套手段就不那么灵验了。工资是按月领的，员工们在进行的是无法预期次数的多次博弈。有理性的员工很快就会发现，听老板的话只会让自己更辛苦。渐渐地他们就会达成默契，从囚徒困境中摆脱出来：原来什么样还是什么样，能偷懒就偷懒。奖金轮流拿；拿了奖金的要大出血，安抚住其他没拿到奖金的。

第9章 囚徒困境巧抉择（1）

第9章囚徒困境巧抉择（1）