第4章囚徒困境：善于合作才能赢（1）

人们总为自己的利益去算计别人，算来算去，最终却可能算计到自己头上。正如“囚徒困境”中的两个囚徒，真是“机关算尽太聪明，反误了卿卿性命”。

如果处于自然状态中，人和人就像狼和狼一样，是每个人对每个人的战争。在这种情况下，每个人都试图保护好自身的利益，并希望侵占他人的一些利益。这样就很容易陷入囚徒困境。

人人皆“囚徒”，岂能无困境

在现实生活中，常常看到很聪明的人最后往往把自己引到一条愚蠢的道路上，这其实可以用博弈论中的一个心理法则来解释。在博弈论里，有一个很有趣的故事或者说现象叫做“囚徒困境”。

一个有钱人的财物被盗贼偷走了。警方在侦破此案的过程中抓到两名犯罪嫌疑人甲和乙，警察还从他们家里搜出有钱人家里丢失的东西。可是，这两个人都矢口否认自己是入室盗窃，于是警察把两人隔离进行审讯。

聪明的探员把两个人分开后，分别告诉他们：“现在我已经确定你犯了偷盗罪，所以应该判你入狱2年。可是我们不妨来做个交易，假如你招供了，而对方没有招供，那么你将以证人的身份出庭，最终会被无罪释放，而对方要被判入狱10年；假如你和对方都招供了，那么你们都要被判入狱5年；如果对方招供了，而你没有招，你将被判入狱15年，而对方则被无罪释放；假如你们都拒不认罪，会各判2年。”

局外人都看得清楚，他们两个人最好的结果是都不认罪，那么他们将只被判2年，这是最好的博弈结果，对两名囚犯来说也是最划算的。

可是人算不如天算，“囚徒困境”之所以叫做“困境”，正是因为这预示着博弈的最终结果往往是人们最不想要的结果，那就是两名囚犯同时选择了招供，于是他们都被判入狱5年。

其实，这也正是探员的聪明之处。探员采用的游戏规则一定会让两个囚犯对自己的罪行供认不讳，认罪伏法。

看到这儿，也许很多读者会有疑问，这两个囚犯真是傻到一定地步了，哪一种结果都比两个人同时招供强，他们怎么会愿意接受这种最差的结果呢？

“囚徒困境”和其他博弈理论相同，它们都需要有两个前提，首先，这两个人都是理性而自私的人，即面对两种可以选择的方法，他们中的任何一方总是选择其中对自己更有利的那个办法；其次，两人没办法进行有效的沟通，所以只能在猜测对方的行为中选择一种结果，自己进行决策。

这两个人的思想斗争过程大概是这样的：

甲囚犯会这样想：如果对方不招，我也不招，只要坐2年牢，可是我们根本没办法沟通，这样的风险太大，而且成功的几率太小了；如果乙招供了，而我没招，那么我就要待在牢里15年，出来以后，我可能什么都不能做了；如果我现在招供，最坏的结果只是坐5年牢，招了还是比较划算的；假如我招供，乙却没有招，我就会被立刻释放，这样说来更是招供最划算。所以，不管囚犯乙是招供还是不招供，囚犯甲都会采取招供的态度，因为这对他确实更有利一些。

当然，这个推理同样也适用于囚犯乙。所以两名囚徒最终都选择了招供，于是，两个人都入狱服刑5年。

两名囚犯都觉得招供对他们来说是最佳选择，除了招供，甲和乙中任何一个人单方面地改变选择，都会得到对自己不利的结果，而在其他的选择中，比如两人同时选择不坦白，可是他们又担心另一方通过单方面的改变以减少自己的刑期，所以他们经过一番理性的算计之后，同时使自己陷入了最差的结局。

事实上，“囚徒困境”里不允许囚犯甲和乙进行沟通的假设和现实生活中的大部分情况是有一定差异的。例如，在20世纪后半期的苏美军备竞赛中，两个超级大国时常进行外交交涉，以便及时交流信息；在各个企业的价格竞争中，很多企业之间也有不同程度的沟通，甚至最终结成价格联盟；在爱情博弈里，许多男女都会彻夜厮守而不厌倦……

此时，不妨也将甲乙两名囚徒的条件放宽，让囚犯甲和乙同时待上几分钟，给他们串供的机会。很显然，交流的主要问题就是如何建立攻守联盟，克服自利心理，甚至还会建立一个口头协定，说出双方都不坦白的好处。

然后，再单独提审甲乙二人，结果往往还和上一次一样。这时，我们依然先分析一下囚犯甲的心理活动：假如囚犯乙遵守约定，那么自己的坦白就能够获得自由；假如囚犯乙告密，如果自己不坦白，则会被判入狱15年。事实上，囚犯甲的想法并没有因为这场沟通或协议而变得明朗起来，他摆脱不了两难的境地，所以最终还是会做出最差的选择。而对于囚犯乙也是相同的。

显然，这两名囚犯都明白“坦白从宽，抗拒从严”的道理，其实从博弈论的角度来看，这本身就是一种“囚徒困境”的法则在起作用。

“囚徒困境”在生活中比比皆是，现实的参与者也许不仅是一个人。

以公共用品来举个例子：比如渔业，公海中的鱼是属于大家的，可是在自己不滥捕，其他人也会滥捕的想法之下，渔民往往选择没有节制地打捞，于是海洋的生态系统被破坏了，渔民的生活也因此受到影响，这便是共同背叛的结果。还有唐杰忠和姜昆所说的一个关于公用楼道占用问题的相声，其实也是一种公共用品的“囚徒困境”。人们在公用楼道中堆满了杂物，结果大家都感到很不方便。人们的想法大致是这样的：如果我不占用公共楼道，其他人也会占用。所以每个人都从自我利益的最大化出发，而结果是让大家的利益受损。由此可见，凡是属于超过两个人的公共财产，常常是很少被人爱护的东西。

“囚徒困境”也是一种游戏规则，它可以让狡猾的囚犯招供，得到应有的惩罚，这固然是好事，但人们却忽略了它其实也是在生活中普遍存在的一种现象。“囚徒困境”之所以被看做博弈论的代表性事件，不但因为它简单易懂，而且因为这是一种在日常生活中广泛存在的现象。就像上面提到的，当时苏美两国虽然经常在一起沟通，甚至还签订了核不扩散的条约，可是军费一年比一年高；企业和企业之间虽然经常相互合作，结成战略联盟时可能还信誓旦旦的，但价格战依然如期爆发；陷入爱情的男女虽然在恋爱时海誓山盟，可最终还是有可能分手……由此可见，“囚徒困境”并不仅是针对真正的囚徒而言的，也许在不知不觉中，我们也曾经陷入或正在陷入这种困境中。

封闭式的袋子交易

1950年，数学家阿尔伯特·塔克尔第一次提到“博弈游戏”，他并没有意识到自己揭开了冰山一角。他在给心理学家们讲演时，用了两个囚犯的故事，把当时专家们正在研究的博弈论问题作了一个形象的描述。显然这个描述是非常成功的。后来，提出的“囚徒困境”准确地抓住了人性中需要相互防范和不信任的一面，让人在生活中做一个成功的“交易”者。

先来看一个“困境”游戏，值得一提的是，参与这个游戏的人是一群专门研究“合作”的专家。

一些博弈论专家曾经应邀到荷兰参加了一次“合作及社会两难困境研讨会”。在会议结束后，路特和麦息克两位学者提议专家们做一个游戏。

他们拿出一个不透明的大袋子，请在场的43位专家和学者拿出一些现金放到这个袋子里。假如到最后这个袋子里的现金超过250美元，他们两个愿意自己掏腰包，退给每个人10美元。可是，假如最后袋子中的钱不到250美元，这些钱将被他们两个没收，放钱的人拿不到一分钱。不妨认真算一下，假如你在会场，你会拿出多少钱放在袋子里呢？

这是一道很简单的算术题，在场的每个人都知道，如果每人放进去7美元，最后的结果就会超过250美元。而且等到那两位学者返还10美元时，还能从中赚到3美元。不管怎么看，这都是一个不赔本的买卖。

但是，这个游戏要求人们不能在一起讨论，也不能看其他人放多少钱进袋子中。

后来，当那个袋子传到两位学者手中时，他们当众数了数，里面共有24559元，离250美元只差一点。

专家和学者们看到这样的结果，顿时一片哗然，大家都不敢相信，事情怎么会是这样子呢？这些参与游戏的人都是德高望重的学者，而且他们刚结束为期两天的“合作研讨会”，这个结果似乎有点讽刺，专家们合作的结果不仅没有超过既定的目标，而且还差了5美元，路特和麦息克胜利了，这些专家们拿不回一分钱。

做完这个游戏，专家们一起讨论这个让人感到意外的结果，有些专家抱怨说只要多一个肯放进去7美元的人就好了，还有些专家说早知道结果是这样，自己宁肯多放几十美元进去，好让每个人都赚到钱，让主持人亏本。人们都在后悔当初自己没有再多放一点点进去。

可问题是，在人们知道结果之前，根本没有人真的想拿出超过10美元来，因为人们都有一种侥幸心理，希望他人拿出自己该付出的部分，假如真是那样，就没有必要比别人多做出一点牺牲，反正多付出了也是浪费，而且也只能在最后得到10美元，所以多数人都不肯多拿一分钱；另一方面，人们还会想，假如自己少出一点，这么多人集钱，一定会超过目标的，而且我只是多赚了一点点；还有人想，如果每个人都拿出7美元，而自己不用付出，就能不冒任何风险白得10美元；即使其他人没有拿出足够的钱，而自己也没有付出，最糟糕的情况不过是拿不到钱而已，这对自己是没有什么损失的，所以有些人的优势策略是——不会放进袋子里一分钱。

因为每个人都为自己的利益着想，所以这个游戏的结果让所有人都失望了，造成这样结果的原因就是每个人都希望别人会为他们付出他们本该付出的部分，而他们又想多得到一点，即使最后不会得到，至少也不会失去太多。

即使把这场交易换成是两个人的交易，在面对相互交换的封闭式袋子时，事先讲好其中一个人在里面放一定数量的商品，另一个人放一定数量的钱。双方固然可能诚实地依照自己所说的，把钱或东西放到袋子中交换；又或者一方把一个空袋子交给对方，也就是一方选择了背叛；还有一种可能就是双方交换的都是空袋子，这当然是最差的结果。在这种博弈里，因为背叛可能获得比较大的利润，所以有很多人选择了背叛，而这种背叛最终也很难得到好的结局。

趋利避害可以说是人的天性，每个人都有自私的一面。英国哲学家霍布斯曾说过：“如果处于自然状态，人和人之间就像狼和狼之间一样，是每个人对每个人的战争。在这种情况下，每个人都试图保护好自身的利益，并希望侵占他人的一些利益。”可以说，人和人之间其实都是“敌对”的关系，每种行为都可能是“战争”，而“囚徒困境”正是准确地抓住了人性中最真实的一面——彼此不信任。生活中有很多“囚徒困境”的例子，只是很少有人注意到他们其实正在进行博弈。

比如两个工业国家之间相互设置的贸易壁垒就是典型的“囚徒困境”。似乎每个国家都在国际贸易中存在着实行贸易保护和保持贸易自由两难的选择。因为自由贸易可以给双方带来利润，所以，假如两个国家同时消除贸易壁垒，就会同时受益。但问题是，不管哪个国家单方面采取行动，消除一方的贸易壁垒，它都会明显感到自己正处于不利于本国经济贸易的状态中。而无论其中一个国家怎么做，在他们看来，另一个国家保持它原有的贸易壁垒，总是获利比较大的一方。所以，每个国家都因利益动机去保持贸易壁垒，虽然这样做的结果比双方合作要差得多。

“囚徒困境”反映的是个人的最佳选择，而不是合作的最佳选择，虽然这个“困境”本身只是一种博弈法则，但在现实生活的各个方面都会频繁出现类似的状况。“封闭袋子式的交易”只能使双方都失去利益，得到人们不想要的结果。

利益，让我们走不出“困境”

“囚徒困境”是一个十分普遍且有趣的社会现象，它的表现形式很简单，却很深刻，可以说它是人类理性活动的一种最形象的表现，然而它的最终结果却可能是通过理性的思考选择了并不怎么好的结果。“囚徒困境”准确地描述了人与人之间存在的互不信任和互相防范的一面。合作会使双方获利，而背叛却能获得比合作更大的利润，所以背叛总是最好的选择，可是当双方都这么想的时候，则一定会导致对双方都不利的结果。

人类在活动中通常都只选择对自己最有利的一面，因而，人们很少去考虑社会或其他人的利益。没有谁会主动改变自己的策略以便使双方都获得更大的利益，即使他们知道这么做获利的可能性很大。

“囚徒困境”也同时折磨着商学院的学生们。一位老教授让自己班里的27名学生进行一次测验，而这次测验的主旨就是把他们带入“囚徒困境”。

老教授先假设每位学生现在都是一个企业的管理者，现在他们要决定自己应该怎么发展。如果想生产质量好的商品来维持比较高的价格就选1；如果想通过生产假冒伪劣产品来通过别人的失去换取自己所得则选2。教授会根据最终选择1的同学的总数，把收入分给每位同学。

第4章 囚徒困境：善于合作才能赢（1）

第4章囚徒困境：善于合作才能赢（1）