囚徒困境通常告诉我们这样的道理:一个人自私地寻求最大效益并不意味着就能得到最好的结果,相反,只有合作才有可能实现最大的利益。
在斯大林时代的苏联,一位乐队指挥坐着火车前往下一个演出地点。正当他在车上翻看当晚要指挥演奏的作品乐谱时,两名克格勃(政治特务)将他作为间谍逮捕了,他们认为那乐谱是某种密码。这位乐队指挥争辩说那只是大音乐家柴可夫斯基的小提琴协奏曲,但无济于事。在乐队指挥被投入牢房的第二天,审问者自鸣得意地走进来说:“我看你还是老实交代了吧,我们已经抓住你的朋友柴可夫斯基了,他这会儿正向我们交代呢。如果你再不招,就枪毙了你。如果交代了,只判你10年。”
在这个讽刺故事中,审问者想耍花招,想运用博弈论中的囚徒困境理论来达到自己的目的。
囚徒困境是一个著名的博弈模型,囚徒困境理论是数学家图克提出的博弈论中最经典的入门理论,经济学家纳什发展和完善了该理论。
一位富翁在家中被杀,其财物也被盗。警方抓到两个犯罪嫌疑人,并从两人住处搜出被害人家中丢失的财物,但他们声称自己是先发现富翁被杀,然后顺手牵羊偷了点儿东西。于是警方将两人隔离,关在不同的房间进行审讯。警方分别对他们说,由于你们的偷盗罪已有确凿的证据,所以可以判你们1年刑期。但是,如果你单独坦白杀人的罪行,可以只判你3个月的监禁,但你的同伙要被判10年刑;如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,而他只被判3个月的监禁;如果你们两人都坦白交代,那么,你们都要被判5年刑。
这两个人面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,那样大家都只被判一年。但由于两人处于隔离的情况下无法串供,从每一个人都利己的假设出发,那么他们选择坦白交代是最佳策略。如果同伙抵赖,自己坦白交代就能得到很短的监禁——3个月;如果对方坦白而自己抵赖了,那自己就得坐10年牢,这太不划算了。因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。
如果他们在接受审问之前能有机会见面并好好谈清楚,那么他们一定会约好拒不认罪,但这还是不行。因为他们很快就会意识到,那个协定也不见得管用。因为一旦他们被分开,审问开始,每个人内心深处那种企图通过出卖别人而换取一个更好判决的想法就会变得非常强烈。这么一来,原本对双方都有利的策略(抵赖)和结局(被判1年刑)还是不会出现。
这就是博弈论中经典的囚徒困境。这场博弈中唯一可能达到的纳什均衡,就是双方都坦白,最后二人同样服刑5年。
假设两个人都是理性人,在这个博弈中,每个人都自私地寻求最大效益,反而就形成了非理性的集体。他们在各自的利益驱使下并没有得到最好的结果。相反,倘若两个人都相信对方、相互合作,那么就能得到对双方最佳的效果——判刑1年。可惜的是,“理性人”不会信任彼此,更不会在危难的时候合作。
在生活中的每个角落,其实都存在着囚徒困境。不过,人们并没有注意去观察,而是将这些现象都忽略了。以平日里最常见的企业广告竞争为例。甲乙两个公司通过广告相互竞争,若甲公司提高广告质量,乙公司不提高,则当甲公司广告被顾客接受时,它会夺走乙公司的部分收入。若二者同时发出质量类似的广告,对双方来说则收入增加很少但成本增加很大。若两家都不提高广告质量,则谁的生意都不会被对方夺走。
于是,双方可以这样选择:
达成协议,谁也不再提高广告的质量——合作。
一方提高广告质量,抢夺对方市场——背叛。
两方都提高广告质量,展开更激烈的争夺——互相背叛。
而在商场竞争中,甲乙两个公司会如何选择?
从个人理性的角度看,两个公司就像两个囚徒一样,不信任对方,无法合作。这样,当背叛成为支配性策略时,两个公司都将陷入广告战,而广告成本的增加很可能就会损害它们的收益。最后,甲乙公司便陷入到囚徒困境之中。
甲乙公司互相背叛,选择增加广告质量,这对于唯利是图的商人来说,是正确的选择。但这一举动,增加了两个公司的负担也浪费了资源。在彼此信息不对称、不信任的氛围下,他们让企业的个体利益占据了主导地位,最终换来的却是两者都费力不讨好的结果——让竞争更加剧烈。而在激烈的竞争中,有可能一方会胜出,但是元气大伤;也有可能两败俱伤;更不幸的是如果这时有第三方插入,坐收渔翁之利,那么双方的损失会比预期更大。而这也是商场竞争中不可避免的博弈。
通过两个例子,囚徒困境的应用已经展现,这足够引起我们的思索:当面临利益攸关的选择,成为被困的囚徒时,我们应该做出什么样的选择?
在个人利益至上氛围的渲染下,人们似乎已经不再相信这样的思维——合作与利他将会带来更好的利己,于是他们成了被困的囚徒。而博弈理论认为,实现合作、改变竞争规则是赢取博弈的根本出路。在身陷困境的时候,慎重考虑自己与他人的利益关系,做出双赢选择是最理想的解决问题的方法。