书城文学品赤壁论博弈
21326100000021

第21章 最好的策略是针锋相对(1)

从囚徒的两难到针锋相对

让我们来谈谈博弈论者提出的“囚徒的两难境地”这个话题。

警察想从被分别关押的两个囚徒身上掏出口供来,两个囚徒的表现可以概括成以下三种情况:

1。两人都不肯背叛同伙,都保持沉默,结果是警局没有证据,两人获得释放。

2。其中一个背叛同伙,背叛者获释,并得到重奖;而不肯背叛的人被判了重刑。

3。两人都背叛了对方,都判以重刑。

这种“囚徒的两难境地”并不是博弈论者凭空想象出来的。只要我们仔细地回想一下现实生活,就知道人类数千年来到处都在做着这样一种“游戏”。例如秦国为了瓦解六国的合纵,除了连横策略之外,就是用收买和打击这两手来制服六国的贵族,对于那些知名人士,能拉拢的就重金收买,不能拉拢的就派武士去暗杀。当今世界上的霸权国家,也是使用胡萝卜加大棒的手法在与那些它们认为不听话的国家打交道。弱国为了自己的利益与生存,相互结盟(今天的欧盟、东盟、北约等就是这样的结合),同时又害怕盟友背叛自己而恐惧着,不时地改变着自己的主张,或是投靠强国,或是采用其他的方法以保全自己。

那么,这两个囚徒最好的办法是什么呢?

最好的办法是保持沉默,即相互都不背叛。如果有一方背叛,那么另一方将来出狱之后也不会轻易罢休,一定会给那个背叛者以更重的惩罚。

罗伯特·爱克斯罗德是一位政治科学家,他是美国密歇根大学巴奇小组的成员。他想出了一个测试的办法,在电子计算机上展开竞赛以显示两个囚徒之间的互动关系。他组织的竞赛思路非常简单,即参加竞赛中的人两两分对,都扮演其中一个囚徒的角色,任何想参加这个程序的人都被成双成对地融人不同的组合之中去,即让参加比赛的科学家都来玩“囚徒的两难境地”游戏。每一个人都可以在结盟与背叛中作出选择。但是他们不是只玩一次这样的游戏,而是一直玩下去,玩上200次甚至更多。这就像魏、蜀、吴三国那样,魏国可以同蜀国结盟,也可以相互背叛;蜀国也可以同吴国结盟,同时也允许相互背叛。这多次的游戏实际上表现在人类在长期的人际关系中,这种关系已经延续数万年或者数千年之久了,而多次的重复就可以用概率论来加以概括了。

这种重复的游戏允许程序作出合作或背叛的抉择时参考前几次的选择。如果只玩一次游戏,那么背叛当然是最好的选择;但是如果玩许多次,情况就不一样了。因为双方都已经了解了对手前几次的选择,各自都建立起了自己的历史和这方面的声誉,有了过去的资料可供参考。不过,对于下一次对方如何出脾,仍是一个未知数。

这位政治科学家的意图是十分明确的,他想测试一下,人类不管对手做何种举措,是一上来就采取信任和合作的态度,还是一上来就采取背叛的办法。抑或还有一种另外的表现,例如后发制人--你敬我一尺,我敬你一丈,你不仁,我就不义!

那么,他们比赛的结果是怎么样的呢?

“事实上,竞赛的第一回合后交上来的十四个程序中包含了各种复杂的策略。但使爱克斯罗德和其他人深为吃惊的是,桂冠属于最简单的策略:针锋相对。这是多伦多大学心理学家阿纳托·拉帕波特提交上来的策略。针锋相对的策略以合作(结盟)开局,但从此以后就采取以其人之道、还治其人之身的策略,它实行了胡萝卜加大棒的原则。它永远不先背叛对方,从这个意义上来说它是善意的;它会在下一轮中对对手的合作进行回报,从这个意义上说它是宽容的;它又会采取背叛的行动来惩罚对手上一次的背叛,从这个意义上来说它是强硬的;它的策略非常简单,对手一望便知其用意何在,从这个意义上来说它又是简单明了的。

“当然,因为只有为数不多的程序参与了竞赛,针锋相对策略的胜利也可能只是一种侥幸,但也许不是,在上交的十四个程序中,有八个是善意的,它永远不会首先背叛,而且这些善意的程序都轻易就赢了六个非善意的程序。为了决出一个结果来,爱克斯罗德又举行了第二轮竞赛,特别邀请人们从针锋相对策略那里把桂冠夺过来。这次有六十二个程序参加了竞赛,针锋相对策略又一次夺冠。结论是无可争议的,好人,或者更正确地说,善意的、宽容的、强硬的、简单明了的人,确实总是赢家。

“针锋相对策略的胜利对生物进化和人类事务所具有的深刻含义是显而易见的。爱克斯罗德在1984年发表的《合作进化》一书中认为,针锋相对策略能导致各个领域的合作,包括最无指望的环境中的合作,仡最喜欢举的例子就是第一次世界大战中自发产生的自己活,也让他人活的原则。当时在前线战壕里的军队约束自己不开枪杀伤人,只要对方也这么做。处于无人区的军队根本无法与地方军队取得联系,而且他们当然也不会是朋友。”(米歇尔·沃尔德罗罗:《复杂》,生活·读书·新知三联书店1997年4月版)

爱克斯罗德等人在电脑中进行的对手间的策略竞赛,是从囚徒的两难境地问题演化过来的。两个人在一起做事,是合作还是背叛,这恐怕是全人类每一个人几乎都会碰到的事情。这一次被人出卖了(受骗上当了),下一次再碰到了那个人会怎么办?这一次欠了他人的情,下一次遇上了会怎么办?这实在是司空见惯的事,也是我们经常要思考的问题。“好,这个人有信用,下一笔生意我们还找他做。”“这家伙太差劲了,是亲戚他还敢骗,下次给他点颜色瞧瞧!”“你敬我一尺,我敬你一丈,你若是给我小鞋穿,对不起,我就送给你一双玻璃小鞋。”像这样一些议论我们不是经常听得到吗?这实际上都是在讲“针锋相对”的策略,只是我们没有把它归纳总结而已。

针锋相对策略的优越性

那么,针锋相对的策略为什么是最佳的策略呢?让我们从“赤壁之战”的例子来看一看吧。

1。曹操带领五十万兵马南征,准备消灭刘备,兼及孙权,这时候正面承受压力的有三股力量,即刘表的力量、刘备的力量和孙权的力量。

刘表死后,小儿子刘琮当权,他听从幕臣和母亲的意见,采取了投降的策略,结果是怎么样呢?

(曹操)让刘琮为改任青州刺史,便叫他立即起程,刘琮一听大惊,推辞道:“我不愿为官,只希望驻守在父母乡土上。”曹操说道:“青州这地方接近帝都,叫你随朝为官,是为了避免在荆襄这里被人图害。”刘琮再三推辞,曹操就是不准。刘琮只得与母亲蔡夫人同赴青州。只有故将王威愿意相随跟去。其余官员都送到江口就回去了。曹操叫过于禁,对他嘱咐说:“你可以带一些轻骑去追赶刘琮母子,追到后把他们杀了,以绝后患。”于禁得令,便带领众军赶上,大声喝道:“我奉了丞相命令,来杀你们母子!你们可早纳下首级!”蔡夫人抱着刘琮大哭。于禁喝令军士下手。王威愤怒,奋力相斗,竞被众军所杀,军士杀死刘琮及蔡夫人。于禁回报曹操,操重赏了于禁。

这个投降派的首领就这样死在了船上。

而刘备和孙权合作抗击曹操,结果我们都清楚,曹操失败了,刘、孙脞利了,其后还建立了吴国和蜀国,两人都当上了皇帝。

2。曹操对关羽过去有恩,关羽便在华容道上义释了曹操(曹操得到了善意回报)。

3。当关羽被刘备任命为前将军,驻守荆州的时候,孙权曾派使者为自己的儿子来向关羽的女儿求婚,这本是一种友好结盟的表示,关羽不但不准许,反而辱骂了使者,这使孙权很恼火,觉得太没有面子,因此两人结了仇。后来关羽被孙权集团打败,抓起来砍下了脑袋(关羽因对孙权的无礼而尝到了恶果)。

所谓的针锋相对,其实包括两个方面的内涵:其一是在对手采取强硬的对抗手段的时候,我们也以其人之道还治其人之身,也使用强硬的手段来还击;其二是当对方以友善的态度对待我们的时候,我也以友好报之。

上面的两个例子告诉我们,刘琮没有使用针锋相对的策略而灭亡了,刘备和孙权使用了针锋相对的策略而保全、发展了自己。这证明针锋相对的策略是最优的策略。

曹操过去对关羽有过恩惠,现在关羽作为回报,放跑了曹操--对于曹操而言,这是针锋相对策略的胜利,所以也证明了针锋相对是最优的策略。

孙权想用笼络与友好的办法与关羽结亲,关羽应当用同样的办法予以报答,结果关羽却用什么“虎女岂能嫁犬子”这样的话来刺激孙权,结果让孙权怀恨在心。如果这时候仡们结亲了,在关羽进攻曹操的时候,孙权说不定还会助他一臂之力,即使不助,也一定会保持中立。这样,关羽不可能有走麦城被处死的命运--这是不使用针锋相对策略的一例反证。

那么,针锋相对的策略为什么会是最优的策略呢?

毛泽东在《抗日战争胜利后的时局和我们的方针》一文中指出:“蒋介石对于人民是寸权必夺、寸利必得。我们呢?我们的方针是针锋相对、寸土必争。”

无论是十年土地革命时期还是在抗日战争时期,或者是在三年解放战争时期,毛泽东和中国共产党最欣赏和最纯熟使用的就是这种“针锋相对”的策略。