书城经济趣味博弈学
29298100000001

第1章 非合作博弈

一、囚徒困境

甲、乙两个人一起携枪准备作案,被警察发现抓了起来。警方怀疑,这两个人可能还犯有一起纵火罪,但没有充分的证据,于是分别进行审讯。为了分化瓦解对方,警方告诉他们:如果主动坦白,可以减轻处罚;如果顽抗到底,一旦同伙招供,就要受到严惩。

如果两人都不坦白,警察会以非法携带枪支罪而将二人各判刑1年;

如果其中一人招供而另一人不招,坦白者作为证人将不会被起诉,另一人将会被重判15年;

如果两人都招供,则两人都会因纵火罪各判10年。

甲、乙两个嫌疑犯在各自的房间里算起了小九九。

甲想:假如乙不招,我只要一招供,马上可以获得自由,而不招却要坐牢1年,显然招比不招好;假如乙招了,我若不招,则要坐牢15年,招了只坐10年,显然还是以招认为好。无论乙招与不招,我的最佳选择都是招认。还是招了吧。

乙想:假如甲不招,我只要一招供,马上可以获得自由,而不招却要坐牢1年,显然招比不招好;假如甲招了,我若不招,则要坐牢15年,招了只坐10年,显然还是以招为好。无论甲招与不招,我的最佳选择都是招认。还是招了吧。

结果甲乙两个人都分别向警方坦白了自己的罪行。

甲和乙两个自认为聪明的人分别被判刑10年。

1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,用两个囚犯的故事,将当时专家们正研究的一类博弈论问题,作了形象化的解释。

从此以后,类似的博弈问题便有了一个专门名称——“囚徒困境”。

借着这个故事和名称,“囚徒困境”广为人知,在哲学、伦理学、社会学、政治学、经济学乃至生物学等学科中,获得了极为广泛的应用。

博弈论由美国数学家约翰·冯·诺伊曼(1903~1957)创立,并与经济学家奥斯卡·摩根斯坦合作于1944年发表《博弈论与经济行为》,把博弈论引入了经济领域。人们把《博弈论和经济行为》看做现代博弈理论诞生的标志。

冯·诺伊曼是当代最伟大的数学家,是现代计算机科学和数理经济学特别是博弈论的奠基人。

博弈又称对策论,是研究两人或多人之间竞争合作关系的一门科学,它使用严谨的数学模型来解决现实生活中的各种冲突问题。

博弈,是一个外来词,在英文里面,博弈这个词是“Game”,也就是我们经常说的“游戏”。实际上,在英语世界里,“Game”的意思不单是游戏,还包含另一种含义,就是人们在一定规则下进行竞赛。这个意思就是“博弈”的词源。

博弈是一种人与人之间的相处状态——请记住是一种状态,而不是所有的状态。

所以,不是所有的人际关系和人类关系都能放在博弈的框架下进行分析和解释的。而博弈本身既包括合作状态下的关系,也包括人与人之间互相竞赛比拼实力的关系。

看起来博弈好像是一个十分高深的概念,但是如果把这个概念具体化,就十分容易理解了。

如果你去超市买东西,在交款的时候,有不同的队列,那么,选择排在哪个队列中能最节省时间,就是一种博弈。

从概率上来讲,队伍的数量越多,你能够做出正确选择的几率就越小。面对这种排队的博弈,你应该如何选择?或者说,要进行排队节省时间的博弈,你会选择什么样的策略?是看现在哪个队伍后面的人最少就去排哪个,还是看不同队伍里面的人所提的东西的多少,抑或是看收银小姐的动作快慢?

而这就涉及博弈论了。

你的选择和决定将会影响到别人的决策结果,同样别人的选择和决定也直接影响着你的决策结果。

二、旅行者困境

两个旅行者从一个以出产细瓷花瓶著名的地方旅行回来,他们都买了花瓶。提取行李的时候,发现花瓶被摔坏了。他们向航空公司索赔。

航空公司知道花瓶的价格总在八九十元的价位浮动,但是不知道两位旅客买的时候的确切价格是多少。

于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。

如果两人写的价格一样,航空公司将认为他们讲真话,于是按照他们写的数额赔偿;如果两人写的不一样,航空公司就认定写得低的旅客讲的是真话,并且原则上照这个低的价格赔偿,而且对讲真话的旅客奖励2元钱,对讲假话的旅客罚款2元。

就为了获取最大赔偿而言,本来甲乙双方最好的策略就是都写100元,这样两人都能够获赔100元。

可是不,甲很“聪明”,他想:如果我少写1元变成99元,而乙会写100元,这样我将得到101元,何乐而不为?所以他准备写99元。

可是乙更加“聪明”,他算计到甲会想他写99元,“人不犯我,我不犯人,人若犯我,我必犯人”,他准备写98元。

想不到甲还要更“聪明”一个层次,计算出乙要这样写98元来坑他,“来而不往非礼也”,他准备写97元……最后两个人都写了1元。

航空公司获得了最大的利益。

“旅行者困境”和“囚徒困境”一样,是博弈论中基本的模型,也是“非合作性博弈”的典型模式。简言之,这一模式代表了处于相同困境状态下,不同的人面对同样的几种选择,最后必将背叛其他人,作出最利于自己的选择的一种情况。

博弈论的基本预设是:人都是理性的。

这个基本预设的含义是:人们在面对问题和一个个具体情境的时候,都不是盲动的、莽撞的、没头脑的,而是能够在选择策略的时候有明确的目标,就是使自己的利益最大化。

这就好比两人下棋,你出子的时候,为了赢棋,得仔细考虑对方的想法,而对方出子时也得考虑你的想法,所以你还得想到对方在想你的想法,对方当然也知道你想到了他在想你的想法。

这就是所谓的“你知道我知道你知道我知道……”的博弈循环。

在花瓶索赔的例子中,两个人都“彻底理性”和“聪明绝顶”,都能看透十几步甚至几十步上百步,而且都聪明地猜到了对方将要采用的策略,但遗憾的是,两个理性人“精明比赛”的结果,是每个人都只写1元的田地。

博弈是一种策略的相互依存状况,你的选择将会得到什么结果,取决于另一个或者另一群有目的的行动者的选择。

三、三只老鼠偷油

有三只老鼠结伴去偷油喝。

当它们好不容易找到油缸的时候,却发现油缸很深,油在缸底,它们只能闻到油的香味,根本喝不到油。

喝不到油的痛苦令它们十分焦急,但焦急又解决不了问题,于是它们静下心来冥思苦想,终于想出了一个很棒的办法:一只咬着另一只的尾巴,吊下缸底去喝油。它们取得了一致的共识:大家轮流喝油,有福同享,谁都不可以抱有独享的想法。

第一只老鼠最先下去喝油,它在缸底想:“油只有这么一点点,大家轮流喝一点不过瘾。今天算我运气好,不如自己痛快地喝个饱。”

夹在中间的第二只老鼠也在想:“下面的油没多少,万一让第一只鼠喝光了,那我岂不是要喝西北风吗?我干吗这么辛苦地吊在中间让第一只鼠独自享受一切呢!我看还是把它放了,干脆自己下去喝个痛快!”

第三只老鼠也在上面想:“油只有那么少,等它们两个吃饱喝足,哪里还有我的份!倒不如趁这个时候把它们放了,自己跳到缸底饱喝一顿,才能一解嘴馋。”

于是,第二只老鼠狠心地放了第一只老鼠的尾巴,第三只老鼠也迅速放了第二只老鼠的尾巴。

它们争先恐后地跳到缸里,浑身湿透,一副狼狈不堪的样子,加上脚滑缸深,它们再也逃不出油缸,凄厉的叫声响彻了整个房子。

三只老鼠最终饿死在油缸里。

聪明自私的老鼠反被聪明自私断送了性命。

从“囚徒困境”的模式我们也可以看到,在这个模式中,理性的人最后的选择都是“背叛”,不通过合作的方式与他人共同摆脱困境。而在现实中,背叛与合作是并存的,而且各方之间的信息也并非都是完全闭塞的。

在博弈局势中,你并不是一个孤零零的个体在做决策,在你做决策的同时,你身边充斥着一群人也在做决策。

你的商业对手、伴侣乃至你的孩子都是聪明而有主见的人,是关心自己利益的活生生的人,而不是被动的和中立的角色。一方面,他们的目标常常与你的目标发生冲突;另一方面,他们当中包含潜在的合作因素。

在你做决定的时候,必须将这些冲突考虑在内,同时注意发挥合作因素的作用。

在具体的现实中,合作还是背叛,弱者的选择都不是固定的,不过尽可能减少损失,让自己得利,这是不变的原则。

四、模拟企业家游戏

一位教授让自己班上的27名学生进行一个博弈游戏,这是一个“事先设计好”的博弈。这个博弈会把他们带入“囚徒困境”。

游戏规则如下:

假设每一个学生都拥有一家企业,现在他必须决定自己应该选择A还是选择B,选择A代表着生产高质量商品来帮助维持较高价格,选择B代表着生产假货以通过别人的损失换取自己所得。

假设选A可奖励2元,选B可奖励2.15元。选A将产生总体收益,选B将无总体收益。同时根据选A的学生总数,将收入分给每个学生。

例如,如果27名学生都选A,则每人各奖励2元。同时总体收益是54元,分配给每个学生是每人各得2元,则每个学生实际所得为4元。

假设有一个学生有了自私自利的心,私自改变主意,改选B,则有26名学生选择A,每人各奖励2元,总体收益是52元,52元平均分配给27个学生,每人各分得1.9元,则选择A的26名学生每人各得3.9元,选择B的一个学生可得4.05元,比原来多得0.05元。

假设有2个学生私自改变主意,改选B,则有25名学生选择A,每人各奖励2元,总体收益是50元,50元平均分配给27个学生,每人各分得1.85元,则选择A的25名学生每人各得3.85元,选择B的2个学生可得4元。

假设有3个学生私自改变主意,改选B,则有24名学生选择A,每人各奖励2元,总体收益是48元,48元平均分配给27个学生,每人各分得1.78元,则选择A的24名学生每人各得3.78元,选择B的3个学生可各得3.93元。

假设27个学生都都选择B,则总体收益是0,每个学生各得奖励2.15元,他们的实际所得是2.15元。

从上面的分析可以看出,只有一个学生选择B的时候,这个学生能获得最大收益4.05元,其他26名学生相对会受损失,只能获得3.9元。只有当27个学生都选择A的时候,每个人都能获得最大收益4元,选择B的学生越多,个人的收益越少。

演练这个博弈的时候,一开始每个学生都被相互隔离开,单独做选择。

结果27名学生都像囚徒困境中的囚徒,都是绝顶聪明的理性人,个个都会算计,他们为了多获得0.05元,不约而同地选择了B。

后来教授允许27个学生相互讨论,以便达成“合谋”,结果愿意合作而选择A的学生总数从3到14不等。在最后的一次带有协议的博弈里,选择A的学生总数是4.

这个游戏比囚徒困境更深刻地揭示了人自私自利的本性。

处于困境时,各方都不知道别人的选择,因而只能猜测,从自己的利益出发去作出选择;他们与困境之间,是一种不可逆转的关系,即他们无法通过自己的力量去左右局势,只能在困境的局势下想办法尽可能让自己的损失最小,获益最大。

这个游戏也可以看做是“非合作性博弈”的典型模式。

简言之,这一模式代表了处于相同困境的状态下,不同的人面对同样的几种选择,最后必将背叛其他人,作出最利于自己的选择的一种情况。

如果你仅仅把这个游戏当成一个游戏或者一种博弈模型就大大的错了,这个游戏在现实中很有代表性。

大家都知道人不是天使,他们往往首先关心自己的利益,正是人类自私的天性导致了社会中大量的“囚徒困境”现象。

一个得到绝密消息的新闻记者为了得到进一步的消息而对来源保密,结果使媒体丧失报道先机;甲机构中一个管理者为了得到一些回报而给乙机构管理者提供商业机密,结果导致甲机构在竞争中失利。由于个体对自身利益的追逐往往会损坏整体的利益。

一旦陷入“囚徒困境”,其中任何一方都无法独善其身,即使双方都有合作意愿,也很难达成合作。

人类的自私天性,使他们陷入“囚徒困境”难以自拔。社会生活和商业竞争中的许多逻辑都与这一困境密切相关。

囚徒困境揭示了自私对合作的破坏作用,但是正如“有利必有弊”这句话,“囚徒困境”给我们带来的也并不全是坏消息。

作为一个虚构的故事,我们会为故事中囚犯不能合作而遗憾;可是如果它发生在现实中,我们就巴不得他们不能合作。

如果两个危险的罪犯通过合作逃脱了法律制裁,一定会给社会造成更大的危害。

同样,如果商家通过合谋控制物价,我们就不能享受合理的价格,这也会大大增加人们的消费成本,降低人们的生活水平。

一旦陷入“囚徒困境”,其中任何一方都无法独善其身,即使双方都有合作意愿,也很难达成合作。

五、渔翁得利

一只河蚌正张开壳晒太阳,不料,飞来了一只鹬鸟,张嘴去啄它的肉。河蚌急忙合起两张壳,紧紧地钳住鹬鸟的嘴巴。

鹬鸟说:“今天不下雨,明天不下雨,就会有死蚌肉。”

河蚌说:“今天不放你,明天不放你,就会有死鹬鸟。”谁也不肯松口。

有个渔夫看见了,便走过来把它们一起捉走了。

“鹬蚌相争,渔翁得利。”这就是不合作带来的悲剧。

标准的囚徒定律模式,是双方处于一个相同的困境状态下,针对可能出现的后果,所作出的最利于自己的选择。

但是,这只是一个模式而已,在现实中,有很多的困境模式,都并不是这么简单而且整齐划一的形式。

有时两人处于相似的困境之下;有时两人的困境完全不同,但造成困境的外在因素相同;有时两人的困境和外在因素都不同,但是具有一定的间接联系。

处于囚徒困境下,仔细分析自己和对方的处境,作出最有效的决断,是最为重要的事情。

六、狐狸先被狮子吃了

驴子与狐狸合伙去打猎。

突然,它们遇见了狮子,狐狸见大事不妙,立即跑到狮子面前,许诺只要自己免于危险,愿意把驴子交给它处置。

狮子答应可以。

于是狐狸便引诱驴子掉进了一个陷阱里。

狮子见驴子已不能再逃跑,便立即先抓住狐狸吃了,然后再去吃驴子。

狐狸在遇到危险时,丝毫没有考虑到自己与驴子的友谊,自认为将驴子交给狮子就可以保全自己,没有想到狮子的目的是找到更多吃的东西,也没有意识到只有自己与驴子共同面对,才有可能逃过这一劫。

驴子死了,狐狸自然更加势单力薄,最终难免遭到同样的命运。

所以说,那些出于私利背叛朋友、背叛友谊的人是不会有好下场的。正像囚徒困境里的那两个囚徒自以为聪明,结果聪明反被聪明误,最终落入监狱。

古人吕坤说过:“人人好公,则天下太平;人人营私,则天下大乱。”

人人都利己,人人都自私,其结果只会是:人与人之间充满了猜忌和怨恨,充满了矛盾和战争,最后的结果必然是人类自身的毁灭。

在危难时刻人性裸露的自私的一面常让人不敢正视。

话剧《同行》讲述了四个朋友一起去野外冒险的经历。70公里的路程,危险重重。后来,剧中的“行人”奋力誓死挽救“野山雀”。可同行的另外两个伙伴在最后一刻为了生存渡河而去,留下奄奄一息的“野山雀”和“行人”空茫的眼神。

相信行人的眼里反射的不仅仅是对危机的空茫,更是对自私人性的恐惧。

既然自私的危害如此之大,那么该如何避免呢?

其实真要做起来并不难。“勿以善小而不为,勿以恶小而为之”。

而人类在后天理性自我改造下形成的“大公无私”、“助人为乐”这种行为准则,更是对我们自私本性的约束与遏制。

将心比心,多一点宽容与理解,多设身处地想想别人,这样我们的生活将会多很多笑容,少很多悲剧。

七、假途灭虢

春秋初期,诸侯并立,兼并战争无休无止。

地处中原地带的晋国在这场弱肉强食的大混战中不断兼并征服小国,势力迅速崛起。

晋献公在位期间,又把其南面的两个小国——虢国和虞国预定为吞并的目标。

可是,晋国要顺利实现这一目标也不是那么容易。

虢、虞两国虽然地狭人稀,国力弱小,但却是源于同一始祖的同姓国家,在地域上互相毗邻,在政治上又结有同盟,晋国同其中任何一个国家无论何时开启战端,都意味着要同时和两国之师相抗衡。

如何拆散虢、虞两国的同盟关系,使自己避免陷于两线作战,这成了晋国在吞并两国的军事行动中首先必须解决的问题。

终于,晋国大夫荀息想出了一条一箭双雕的妙计:即用厚礼重金贿赂收买虞公,拆散虢、虞之间的同盟,向虞国假道攻打虢国,待虞国中计,虢国败亡后再图后举。

晋献公听了荀息这一计后,认为计谋很好,但是还存在一定的顾虑,一是有些舍不得自己的珍宝,二是怕虞国的君臣会揭穿晋国的用心。

针对晋献公的犹豫,荀息一一予以妥善地解释,指出送珍宝给虞国,等于是将它暂时存放在那里,迟早还会再收回;至于虞国内部的大臣,虽有些能耐,但他们的意见虞公不一定会采纳,不足为惧。

一番话打消了晋献公的最后顾虑,他决定依照荀息的计谋展开行动。

不久,荀息携带着良马、美玉等奇珍异宝出使虞国。到了那里后,立即晋见虞公,献上珍宝,并向虞公正式提出借道攻虢的要求。虞公既贪利收下了良马、美玉,又不敢轻易开罪于晋国,于是便应允晋国军队通过虞国土地去征伐虢国,并表示愿意出兵协助晋国作战。

虞国大夫宫之奇认为此事大为不妥,在一旁加以劝阻,但虞公根本听不进去,只是一意孤行,硬朝着晋人的圈套里钻。

公元前658年,晋大夫里克、荀息统率晋国军队通过虞国的土地去攻打虢国,虞公则派出军队同晋军会师,然后协同晋军展开军事行动。晋军在虞军的积极配合下,进展顺利,很快攻占了虢国的下阳(今山西平陆),一举控制了虢、虞之间的战略要地,并通过此事进一步摸清了虢、虞两国的虚实,为下一步行动创造了条件。

时隔三年,晋献公又一次向虞国提出了借道伐虢的要求。这时宫之奇指出虢国如果灭亡,虞国必然跟着完蛋,警告虞公“晋不可启,寇不可玩”,力图以虢、虞两国“辅车相依,唇亡齿寒”的利害关系劝虞公不要假道于晋。

可是虞公不采纳宫之奇的建议,又答应了晋国借道的要求。宫之奇见虞国灭亡近在旦夕,为避祸乱,便率领族人逃离了虞国。

这次晋献公亲自统军借道虞国攻打虢国,声势远较前一次更大,可见其志在必得。

晋军进展迅速,很快兵临虢都上阳城下,围困虢国。虢国弱小无援,数月后即为晋军所灭,虢公仓皇逃奔京师(今洛阳)。

晋军随即凯旋回师,行经虞地驻扎时,乘其不备发动突然袭击,生俘虞公,轻而易举地灭亡了虞国,最终达到了吞并两国的目的。

这个故事经常被人们看做是小国的君主目光短浅,缺乏长远的眼光,最终导致自己的国家覆亡的例子。

“各家自扫门前雪,莫管他人瓦上霜”作为中国人的一种立身处世的态度,其背后的原则就是非合作性博弈。

如果说“兄弟言和于墙,共御外辱”是理想化的摆脱囚徒困境的策略,那么出卖“兄弟”以换得自己的平安,则是处于囚徒困境下本能的选择。

趋利避害是人的本能,在经济行为和社会行为中这种本能都鲜明地体现着。

趋利,避害,这二者对立统一。当人感到即将受到威胁时会本能地抵御;当有利益诱惑时,会本能地追逐利益,并追求利益最大化。

对于企业而言,本能的目标是趋利避害,并使趋利避害最大化。企业之间在一定程度上只有趋利避害,由对抗走向合作,才能使企业长久地发展壮大。

人们只希望自己的行为对自己无害,并不想对他人有利。这种心理是典型的“背叛策略”。