书城管理博弈
47454200000002

第2章 聪明囚徒的困境

合作?还是背叛?这是一个问题。“囚徒困境”准确地抓住了人性的不信任和需要相互防范背叛这种真实的一面。

甲、乙二人合伙作案,结果被警察抓了起来,分别被隔离审讯。在不能互通信息的情形下——也就是彼此不知道对方是坦白还是缄默的前提下,每个嫌疑犯都可以作出自己的选择:或者供出他的同伙,即与警察合作,从而背叛他的同伙;或者保持沉默,也就是与他的同伙合作,而不是与警察合作。这样就会出现以下几种情况:

如果两人都不坦白,警察会因证据不足而将两人各判刑1年;

如果其中一人招供而另一人不招,坦白者作为证人将不会被起诉,另一人将会被重判15年;

如果两人都招供,则会因罪名成立各判10年。

这两个嫌疑犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果——只判刑1年。但他们不得不仔细考虑对方可能采取的选择。问题就这样开始了,两个人都十分精明,而且都只关心减少自己刑期,并不在乎对方被判多少年(人都是有私心的嘛)。每个人都会这样推理:

假如对方不招,我只要一招供,立马可以获得自由,而不招却要坐牢1年。显然招比不招好。

假如对方招了,我若不招,则要坐牢15年,招了只坐10年。显然还是招更好些。

可见无论对方招与不招,我的最佳选择都是招认。两个人都会基于同样的想法作出招供的选择,这对他们个人来说都是最佳的,即最符合他们个体理性的选择。但就整体而言却是一个最差的结果。

为什么会发生这样的事?对于任一个嫌疑犯而言,他在这场博弈中所寻求的最稳定策略。也就是说,无论对方怎样行动,我的策略都能保证我不是“被害者”。对方背叛,我也背叛求的是“不吃亏”,而对方的不坦白与抗拒,也会给我提供可乘之机——即背叛能得到更多。总而言之,我的背叛总是好的。尽管两个人都招供,对两个人而言并不是集体的最优选择。

就是这个故事使博弈论有了一个重要的名词:囚徒困境。在1950年,数学家阿尔伯特·塔克尔(AlbertW.Tucker)第一次提到这个“博弈玩具”时,他并没有意识到是他揭开了冰山的一角。在给一群心理学家讲演时,他用两个囚犯的故事,将当时专家们正研究的一类博弈论问题,作了形象化的描述。这个形象的描述显然极为成功。

因为人类的天性是趁利避害的,是自私的。用英国哲学家霍布斯的话说,“自然状态”中人与人之间像狼与狼一样,是“每个人对每个人的战争”。在这种状态中,每个人都力图保护自己的利益,并企图占有别人的东西,此时,每个人是每个人的敌人。此时没有任何规则,没有财产,没有正义或不正义,只有战争。而“囚徒困境”恰恰准确地抓住了人性的真实一面:相互防范背叛与彼此的不信任。

这可以说是理性的人类社会活动最形象的比喻。两个工业国家之间相互设置贸易壁垒便是“困境”的一个很好的例子。

任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护的两难选择。由于自由贸易能给双方带来好处,因此,如果两个国家消除这些贸易壁垒都能受益。问题是,无论谁单方面采取行动消除自己一方的贸易壁垒,它都会发现自己处于不利于本国经济的贸易状态下。事实上,不论一个国家如何做,另一个国家保持它的贸易壁垒总是比较有利的。因此,每一个国家都有利益动机来保持贸易壁垒,尽管由此带来的结果比双方都合作差得多。

让我们来看一个发生在真实生活中的“困境”游戏,有意思的是,玩这个游戏的人是一群专门研究“合作”的专家。

在荷兰召开了一次“合作及社会两难困境研讨会”,与会者当然都是博弈论的专家。当大会结束之后,有两个学者,麦息克和路特提议大家玩一个游戏。

他们将一个大信封拿出来,请在场的43位学者专家拿出金钱装到这个信封里。如果到最后这信封里的钱超过250元,麦息克和路特将自己掏腰包,退还每人10元。不过,如果最后信封内的钱不足250元,就统统没收,大家拿不到半毛钱。仔细想一想,如果你也在场,你会奉献多少钱呢?

让我们来简单地计算一下每个人应该要放入的数目:250÷43=5.81。如果为了防止一些小气鬼少付或不付,你也可以再多加一点。如果每人放进去7元钱,应该就可以超过目标250元了。等到最后退还10元钱时,每人都还可以净赚3元呢。

无论怎样,这看来都是一个稳赚的买卖。

不过,这游戏特别要求大家不准讨论,也不能偷看别人把多少钱放进信封里。

最后,等到大信封传回来的时候,两位主持人打开一数,里面的钱总共是245.59元,比目标250元就差那么一点点。

看到这种结果,这些学者们群情哗然,一副不敢相信的样子。这种事情怎么可能发生?他们统统是德高望重的学者,而且才刚刚结束了两天的“合作研讨会”啊!他们的合作结果居然比目标还少了近5元钱,这下子,大家统统拿不回来半毛钱了。

事后大家一块儿讨论这个令人意外的结果,有些人抱怨只要再多一个有良心的人放进去7块钱就好了;有些人后悔自己应该再多放一点点的;更有—些人说:“早知道这样,我宁可那时候放十几块钱,最后让每个人有钱赚,让主持人付账。”

但问题是:事先根本不可能有人会真的奉献超过10元。因为我们都预期别人会拿出他们所该奉献的那部分。如果真是那样,那么我就没有必要比别人多出一点,反正多出来的部分就是浪费。另一方面,如果我一个人少付一点点,最后也还会超过目标嘛,让自己多赚一点点大概没啥关系吧。

如果别人都付7元,而你不付钱,你可以不冒风险就白白赚10元;如果别人没有付足够的钱,你也没付,最坏的情况只是赚不到钱,你并没有损失什么。因此你的优势策略就是:根本不要放进去半毛钱。

每个人都基于这样想法的话,最后的结果总是令人失望的。造成这种结果同样是因为每个人都预期别人会拿出他们的本该奉献的部分,而自己又想尽可能地多“捞”一点,因此才会产生每个人都拿不回钱的结果。

20世纪80年代,当美国的航空业仍受政府管理时,各航空公司对于飞机票价不得自由调整。虽然票价不能任意调降,各航空公司为了吸引顾客,就各出奇招招揽客人:其中最著名的就是所谓的免费里程累积活动。航空公司根据客户所累积的飞行里程数来赠送免费机票,而这项促销活动很受客户的欢迎。

此例一出,其他的航空公司万不得已纷纷跟进,否则根本拉不到顾客。虽然首开先例的几家航空公司在刚开始的时候的确大赚一票,但是等到其他公司采取同样措施的时候,大家又统统恢复到没有赠票活动前的市场分配上。这时候。赠票所得到的优势没了。这种免费机票就变成航空公司的沉重负担。

根据1994年《时代》周刊的统计,在美国,每7个飞机乘客中,就有一个是使用这种免费机票的。为了减轻负担。联合航空公司在1994年宣布将客户们的免费里程数“贬值”,本来只要2万英里的里程数就可以换一张美国国内机票,现在需要2.5万英里才行。这个决定遭到顾客的强烈反对和抗议,联合航空公司还被告到了法院。这时候他们想要把这种活动叫停,恐怕也已经太晚了。真是早知如此,何必当初。