书城管理博弈
47454200000016

第16章 “冤冤相报”何时了?

如果你总是想赢对方,结果可能得不偿失。因为对方也会全力反击,造成“两败俱伤”的局面。

在“重复囚徒困境游戏”中有这样一种现象,即总是以背叛挑起事端的非善良策略往往会遭到对方报复,而受到报复者再以报复相报,如此冤冤相报,因而得分都很差。一个策略若是太具侵犯性的话,结果会招来自己设下的厄运:率先背叛者往往要付出沉重的代价。

任何一个策略在博弈的过程中,一定要注意可激怒性有它的危险,即如果对方确实只想尝试一次背叛,报复将导致进一步的报复,冲突将恶化成无止境的双方背叛,这当然是一个严重的问题。

“一报还一报”这个策略的不足之处就在于其太容易挑起报复的行动了。在电脑的世界里,它的运作似乎很完美,但是在现实的世界中,人的情绪反应、大意错误实在是太容易发生了。如果有什么误解或错误发生,报复行动仍然无法避免。而且,一旦落入这种报复的循环之后,双方就比较难跳出这种恶性循环了。这个时候,即使双方都没有继续对抗下去的意愿,可还是只能咬牙坚持,这真是对人类理性的一大嘲弄。

由于“一报还一报”的核心就是对任何行为都要给予及时有效的回报,当遭遇他人侵犯时一定会以牙还牙;当然,这种策略的前提是“不主动侵犯他人”,这大大降低了相互伤害的机会。

在一个规则明确的游戏里它也许可以得到完美的遵循,但在现实生活中,各种社会关系、各种欲望和利益冲突的复杂性,使“不主动侵犯他人”这一限定条件变得模糊不清了。也许你认为自己只是在以正当手段谋求个人的利益,或者只是奉命行事,可是有人会认为你已经侵犯到了他的权益,他有权作出报复。而受到报复的你会认为对方是无端挑衅,同样也作出反击。由此,就很容易形成双方相互惩罚对方的“侵犯”、冤冤相报的局面,而可悲的是,这场也许会使双方毁灭的争斗并没有一个清晰的理由。

这样的悲剧在人类历史中可以说层出不穷。过去的家族间世代血仇有的可以持续上百年,双方的每次冲突都会激发新的仇恨,而两家最初的仇恨缘由也许根本无人知晓。国家和民族间也有同样的问题,甚至到了今天仍可以表现出来。如巴以冲突中,为了抗议“以色列的侵略行为”,“哈马斯”等激进组织利用“人体炸弹”袭击以色列平民;而为反击这种“恐怖行为”,以色列出动军队“定点清除”,每一次攻击的报复都给双方心中增添了一份仇视和不信任,也给问题的和平解决增加了难度。

人们都同意,为了从上述那种冤冤相报的麻烦中解放出来,人们应该“抛弃过去,面向未来”。可是这一原则在现实中应用却困难重重,因为放弃武力威慑不但意味着情感和利益上的损失,而且在互不信任的境况里,也很难保证得到对方的善意回应。

人们之所以相互仇视和伤害,仅仅是因为他们无力摆脱“威慑与反威慑”的怪圈。“鹬蚌相争”就是一个循环威慑导致双输的结局。问题不在于它们是否愚蠢,而在于它们根本无法走出这一困境。因为任何一方的主动撤退,都可能使自己陷入任人宰割的处境。所以“合乎逻辑”的选择是,保住自身的王牌,等待对方先让步。可是双方都这样做时,这个困境就永远无解。

为了解决它易被挑起报复的缺点,学者们建立了一些改良方法。这些改良方法更多一点宽容,要么容忍对方偶尔的侵犯行为,要么降低报复强度。

这种改良式的方法强调信任以及宽容,对于对方前几次的侵犯行为都当做是其无心之失。直到这种行为屡次出现,并且超出预定的次数或比例之后,才采取报复行动。至于如何决定这种脱轨行动的上限,这得看对方过去的记录,或者比较其他类似团体的失误比例。当游戏中考虑到随机干扰,即对策者由于误会而开始互相背叛的情形时,即以一定的概率不报复对方的背叛;并实行“悔过的一报还一报”,即以一定的概率主动停止背叛。群体所有成员处理随机环境的能力越强,“悔过的一报还一报”效果越好,“宽大的一报还一报”效果越差。

清晰、善意、刺激性和宽容性等基本性质看起来很可能恰好符合任何能将自己解脱出囚徒困境的行为准则的要求。不过,“一报还一报”策略在惩罚一个有过合作历史的人时显得过于急躁了一些。我们必须找出一个更能区别对待的策略:这一策略应在背叛只是偶尔为之时显得宽容一些,而在背叛成为一种惯常行为时又能果断地实施惩罚。

比如说,某客户与你们往来频繁,一向信誉良好,与你们合作愉快。三个月前却突然有逾期付款的现象。你们虽然注意到这点,倒是并不在意,认为这是偶发事件。可是这三个月以来,该公司类似的现象出现了三次,比例之高显然已经超过你们其他优良客户的平均记录。那么这可能就是你们该采取行动的时候了。

在管理学中,有一种属于品质管理方式的流程控制,专门用来检查生产系统是否发生了需要处理的异常现象。虽然发生异常现象提高产品的合格率,按常规来讲应当立刻处理。但是,在24小时连续运作的工厂中,将生产线停下来检查也是一种很巨大的损失。除非确定这真的是异常现象,而不是检验或抽样上的失误,否则停下生产线来检修将是一笔不必要的损失。流程管理要根据以往的记录,预先设定异常现象的上限及下限,如果超过这些控制限度,才准许停机检修。

“改良式一报还一报”也是基于类似的原则来进行的,在这种新式的“一报还一报”的方法中,我们会以更大的宽容来包涵对方的无心之失,同时仍保有制裁对方的力量。这种鼓励合作,吓阻叛离并且宽容错误的做法,将对这种囚犯两难困境提供一个有效可行的解答。你可以考虑遵循以下指导原则,作为迈向这一方向的一步。

(1)开始合作。

(2)继续合作。

(3)计算在你合作的情况下对方看上去背叛了多少次。

(4)假如这个百分比变得令人难以接受,转向“一报还一报”策略。注意,与以前不同,此时的“一报还一报”策略不是作为对良好行为的奖赏,相反,却是对企图占你便宜的另一方的惩罚。

要想确定令人难以接受的背叛的百分比是多少,你必须了解对方行为的短期、中期和长期历史。仅看长期历史是不够的。一个人合作了很长时间并不意味着他不会在声誉开始下降的时候企图占你的便宜。你还要知道“最近你都对我做过什么”。

比如,你可以运用这样一种程式:从合作开始,如此继续下去,直到情况符合下面4个检验中的1个。

第一印象:第一轮就背叛绝对不可接受。转向“一报还一报”策略。

短期:任何3轮当中出现2次背叛也是不可接受的。转向“一报还一报”策略。

中期:过去20轮当中出现3次背叛也是不可接受的,转向“一报还一报”策略。

长期:过去100轮当中出现5次背叛也是不可接受的,转向“一报还一报”策略。

用“一报还一报”策略惩罚不必永远持续下去。记录对方符合上述4个测试的频率。出现第一次背叛之后,进行20轮如回声一般的以牙还牙的相互报复,然后改为合作。同时将对方置于观察期,严密监视。另将中期和长期测试当中可能允许出现的背叛次数减1。假如对方在观察期内的背叛次数没有达到这一数字的50%,就可以将他的背叛记录清为零,重新开始计算。假如对方在观察期内犯规,那就采取“一报还一报”策略,永不改变。

对于第一印象以及短期、中期和长期印象,其确切规则取决于错误或误会发生的几率、你对未来获益和目前损失的重要性的看法,等等。

不过,在并不完美的现实世界里,这种策略很可能胜过“一报还一报”策略。

必须记住的一个重要原则是,假如有可能出现误会,你不要对你看见的每一次背叛都进行惩罚。你必须猜测一下是不是出现了误会,不管这个误会来自你还是你的对手。这种额外的宽容固然可使别人对你稍加作弊,不过,假如他们真的作弊,他们的善意也就不会再有人相信了。

最终误会出现时,你再也不会听之任之。所以,如果你的对手有投机倾向,他终将自食其果。