)第一节 博弈故事 办公室的高纸板
在一间大约100平方米的办公室里,十几位白领每天按部就班地工作着。但是平静的日子被其中一个人打破,他在整齐划一的办公桌之间的木隔板上,自作主张地增加了一块纸板,比左邻右舍高出了大约20厘米。尽管他选择了一个夜晚来实施这一行动,并请油漆匠将纸板漆成了和隔板一致的颜色,但是第二天同事们上班时,还是发现了它的存在。
他们一致抗议。理由是在这间巨大的办公室里,这块20厘米高的纸板打破了整个办公室的协调与统一。他们认为,这20厘米高的纸板所体现出来的独特性和个性,或者说与众不同的东西,是对周围整体环境协调性的蓄意破坏,更是一种骨子里的自私和对于秩序的蔑视和背叛。
单位里一位新提拔的处级干部,一大早巡视办公室,立刻发现了这一变异。尽管他并不在这间办公室里工作,而且这点变化也不在他的管辖范围之内,但是他马上对这个人的举措表示了不满和担忧,规劝说:“年轻人,不要标新立异,更不要别出心裁,这样是要吃大亏的!”
在以后的若干天里,人们来到办公室,都不免要议论几句。时间一天天过去,那块起初被视作眼中钉的纸板,渐渐地在同事们眼中习以为常了。于是,当这个人在众人面前主动将它拆掉时,也没有谁大惊小怪。
这个故事中包含的道理正是我们接下来要讲的博弈中的一种策略,即—鹰鸽博弈。
)第二节 博弈解析 进化稳定的博弈
鹰鸽博弈的模型如下:
鹰搏斗起来总是凶悍霸道,全力以赴,孤注一掷,除非身负重伤,否则决不退却。而鸽是以风度高雅的惯常方式进行威胁恫吓,从不伤害对手,往往委曲求全。
如果鹰同鸽搏斗,鸽就会迅即逃跑,因此鸽不会受到伤害;如果是鹰跟鹰进行搏斗,就会一直打到其中一只受重伤或者死亡才罢休;如果是鸽同鸽相遇,那就谁也不会受伤。
每只动物在搏斗中都会选择这两种策略之一,即“鹰策略”或是“鸽策略”。对于为生存竞争的每只动物而言,如果“赢”相当于“+5”,“输”相当于“-5”,“重伤”相当于“-10”,“不受伤”相当于“0”,最好的结局就是对方选择鸽策略而自己选择鹰策略(自己+5,对手-5),最坏的结局就是双方都选择鹰策略(双方各-10)。
鹰鸽博弈的稳定演进策略共有三种:一种是鹰的世界,即霍布斯的原始丛林;一种是鸽的天堂,既各种乌托邦;还有一种是鹰鸽共生演进的策略,这要求混合采取强硬或者合作的策略。
这个博弈很多人认为等同于斗鸡博弈。不过,斗鸡博弈的双方是两个兼具侵略性的个体,而鹰鸽博弈却是两个不同群体的博弈,一个和平,一个侵略。在只有鸽子的一个苞谷场里,突然加入的鹰将大大获益,并吸引同伴加入。但结果不是鹰将鸽逐出苞谷场,而是双方按一定比例共存,因为当鹰群增加一只鹰的边际收益趋零时(鹰群发生内斗),均衡将到来。
由此产生了进化稳定策略,也就是说一旦均衡形成,偏离的运动会受到自然选择的打击。也就是鹰群饱满后,再试图加入的鹰将会被鹰群排挤。
进化上的稳定均衡最大的好处莫过于保持稳定。但问题在于形成强势的路径依赖,也就是胜出的不一定是最好的。因为最好的会被当作出头鸟干掉,而整个集体只会止步不前。
鹰鸽博弈
)第三节 博弈活用 稳定局面,共同发展
群体决策的重要性
在鹰鸽博弈当中,如果两者强行地选择鹰策略或者选择鸽策略,都会让参与者感到目的没有达到。所以最好的情况是出现鹰策略的同时也出现鸽策略。
但是在现实生活当中,对于个体来说,最好的决策是取决于大多数人的策略的。一旦所有的人都一致认同某种策略的时候,那么就会沿那个策略的方向坚定地走到底了。
科学家曾经进行过这样一个试验,来证明这一规律。
他们将四只猴子关在一个密闭房间里,每天喂食很少食物,让猴子饿得吱吱叫。然后,实验者从房间上面的小洞放下一串香蕉,一只饿得头昏眼花的大猴子一个箭步冲向前。可是当它还没拿到香蕉时,就触动了预设机关,被泼出的滚烫热水烫得全身是伤。后面三只猴子依次爬上去也想拿香蕉时,一样被热水烫伤。于是众猴只好望蕉兴叹。
几天以后,实验者用一只新猴子换走一只老猴子,当新猴子肚子饿得也想尝试爬上去吃香蕉时,立刻被其他三只老猴子制止。过了一段时间,实验者再换一只新猴子进入,当这只新猴子想吃香蕉时,有趣的事情发生了。不仅剩下的两只老猴子制止它,连没被烫过的半新猴子也极力阻止它。
实验继续,当所有猴子都已被换过之后,没有一只猴子曾经被烫过,上头的热水机关也被取消了,香蕉唾手可得,却没有猴子敢去享用。
为什么会出现这样的情况呢?由于取食香蕉的惩罚印象深刻,因此虽然时过境迁、环境改变,后来的猴子仍然无条件服从惩罚的规则,从而使整体进入路径依赖状态。
路径依赖理论被总结出来之后,人们把它广泛应用在各个方面。在现实生活中,由于存在着报酬递增和自我强化的机制,这种机制使人们一旦选择走上某一路径,要么是进入良性循环的轨道加速优化,要么是顺着原来的错误路径急速下滑,甚至被“锁定”在某种无效率的状态下而导致停滞,想要完全摆脱变得十分困难。
换句话讲,对于个体来说,最好的策略取决于种群的大多数成员在做什么。由于种群的其余部分也是由个体组成,而它们都力图最大限度地扩大其各自的成就,因而能够持续存在的必将是这样一种策略:它一旦形成,任何举止异常的个体的策略都不能与之比拟。
通过改进促进更大的进步
在鹰鸽博弈当中,参与者会经常要抉择不同的方案。
在很多情况下,一个方案会比另一个方案好得多。但即便如此,并不表示更好的方案一定会被采纳。如果一个方案已经制定了很长时间,现在环境发生了变化,即使出现了更可取的方案,这时要想改革也是非常不容易的。
键盘是电脑配件中一个非常不起眼的部件,但却是必不可少的输入设备,无论是操作电脑还是玩游戏都得通过它来完成。近140年前的1868年,键盘出现在斯托弗·拉思兰·肖尔斯所发明的机械打字机上,当时的键盘是由26个英文字母顺序排列的按钮所组成。因为打字机的设计是人在打字时按下的键,通过字棒打印在纸上,当人们熟练应用,打字速度加快时,字棒开始追不上人手打字速度,经常交叠在一起,从而出现卡键现象,直到19世纪后期,对于打字机键盘的字母排列仍然没有一个标准模式。1837年,克里斯托弗·肖尔把键拆下来,将较常用的键设计在较外边。较不常用的放在中间,从而形成目前众所周知的Q、W、E、R、T、Y键排列在键盘左上方的方案。这种排法也就因其左上方第一行的头六个字母而被称为“QWERTY”排法。
选择这一排法的目的是使最常用的字母之间的距离最大化。这在当时确实是一个解决方案:有意降低打字员的速度,从而减少各个字键出现卡位的现象。但是销售商对这种排列产生疑问,于是肖尔斯撒谎说,这是经过科学计算后得到的一个“新的、改进了的”排列结果,可以提高打字速度。这完全是撒谎,凡是用熟练键盘的,字母怎么排列打字速度都会快。可是当时人们就信以为真,并且把用其他方法排列字母的打字机挤出了市场。
QWERTY的设计安排并不完美,甚至可以说非常糟糕。因为设计者错误地把问题定位为人们打字太快。但是,“快”其实不是一个问题,人们使用打字机,时间一久便会熟能生巧,愈打愈快,这是无可避免的。而且打字机是为了方便人们以短时间完成文章的,所以快也是应该的。因此,设计者应把问题定位于字棒太慢才对。然而,随着1904年纽约雷明顿缝纫机公司大规模生产使用这一排法的打字机,这种排法实际上也成为产业标准。
随着科技的发展,后来的电子打字机已经不存在字键卡位的问题。工程师们也发明了一些新的键盘排法,比如DSK(德沃夏克简化键盘),能使打字员的手指移动距离缩短50%以上。同样一份材料,用DSK输人要比用QWERTY输人节省5%-10%的时间。但QWERTY作为一种存在已久的排法,被人类广泛利用到电子词典、电脑等地方,成为键盘的标准设计。不仅几乎所有键盘都用这种排法,人们学习的也多是这种排法,因此不大愿意再去学习接受一种新的排法。于是,打字机和键盘生产商继续沿用QWERTY标准。
假如DSK标准从一开始就被采纳,今天的技术就会有更大的用武之地。不过,鉴于现在的条件,我们是不是应该转用另一种标准?事情并不是那么简单。在QWERTY之下已经形成了许多不易改变的惯性,包括机器、键盘以及受过训练的打字员。这些是不是值得重新改造呢?
从整体社会发展的角度看,答案应该是肯定的。第二次世界大战期间,美国海军曾广泛使用DSK打字机对打字员进行再培训。结果表明,再培训的成本只要使用新型打字机10天就能全部得到弥补。
私营企业主愿不愿意做这个再培训的工作呢?假如他们知道这样做从经济角度上看是合算的,大概也会这样做。但是发现DSK的好处是一件并不容易而且要付出代价的事情。因此没有几个私营企业主愿意提供再培训服务,却要由某个像美国海军这样的大型机构充当第一个吃螃蟹的人。随着机械打字机被电子打字机和电脑键盘取代,即便是现有的QWERTY键盘存货也不能像以前那样阻挠改革。因为现在各键的排法只要改变一个小芯片,或改写某个软件就能完全实现。
不过,事实证明我们就是跳不出那个恶性循环。没有一个个人使用者愿意承担改变社会ESS策略的成本,个人之间的难以协调,把我们紧紧束缚在QWERTY之上。历史上那个导致几乎100%的打字员都使用QWERTY的偶然事故,现在看来具有使其自身永生不朽的本事,即便当初推动发明的理由早已不存在了。
QWERTY不过是历史问题怎样影响今日选择的一个证明。在某一历史阶段曾经必须考虑的理由,到了今天可能已经无关紧要。今天,在选择相互竞争的技术时,类似打字机键卡位这样的问题与最终选择的得失已经毫无关系。在历史无法重新来过的情况下,如果使这种不好的路径依赖得以改变,仍然有可能使每一个人都从中受益。但历史上出现的偶然事故,不一定可以由今天的市场加以修正,市场的力量在这方面没有太多用武之地,我们选择QWERTY键盘的经历,迫使我们不得不继续使用这种相对比较差的技术。
通过鹰鸽博奔论的分析我们发现,出现相对较差的标准,与其说是技术上的问题,不如说是行为上的问题。
假如要改变一个相对比较差的标准,公众政策可以引导大家协调一致地转向。在键盘的例子里,如果多数电脑生产商一致选择一种新的键盘排法;或者一个主要雇主(比如政府)愿意培训其职员学习一种新的键盘,就能将这个均衡完全扭转,从一个标准转向另一个标准。
一步一步实现改变
从上一个故事中,我们发现在鹰鸽博弈当中,如果一旦形成了依赖,人们就会一条路走到底,而不追求变革和更新。那么要怎么做才能让最好的方法得到实施呢?
在现实生活中,如果人们一味地满足于目前的技术、目前的方案,那么新的点子、更好的方案可能就不会被考虑。我们要学会不断地推陈出新,不要过分依赖于已有的水平。下面,我们不妨来看看一个例子。
春秋时期,楚庄王起用了一位了不起的政治家孙叔敖。孙叔敖青年时随父亲到郢都,正碰上令尹都越椒作乱,父亲被杀,孙叔敖回家乡隐居。后来,楚庄王在大臣虞丘子的推荐下,派人用王辇去迎孙叔敖。庄王同他谈了一天,发觉他很有见识,就拜他为令尹。孙叔敖治国的最大特点是施教导民,唯实而不唯上。在想办一件利国利民的好事时,不靠脱离实际的行政命令,而是依靠高超的政治智慧。
随着实力的增强,楚国与中原各强国的冲突也日益增多,对于作战用的战车的需求也相应的增加。但是楚国民俗习坐矮车,民间的牛车底座低,不适于在战时用作马车。楚庄王准备下令全国提高车的底座。孙叔敖说:“下令太多,民不知所从,这不好。如果您想把车底座改高,我请求您让各个地方的城镇把街巷两头的门限升高。乘车的人都是有身份的君子,他们不能为过门槛频繁下车,自然就会把车的底座造高了。”
庄王听从了他的建议,没有发布政令,而是由官府机构统一放弃底座低的矮车,而改造高车乘用,同时在大小城镇的街巷两头设一较高的门限,只有高车才能通过,矮车就会被卡在那里,靠人推才能通行。这样过了不到三个月,全国的牛车底座都升高了。对这件事,司马迁评价说:“此不教而民从其化,近者视而效之,远者四面望而法之。”
实际上,孙叔敖的这一做法,包含着很深刻的博弈论智慧在其中。在他的方法中,提高门槛的高度,相当于对底座较低的矮车进行的一种惩罚和为高车提供的一种便利。最开始的时候,使用矮车的“君子们”受到种种限制,产生种种不便,无法顺利通过街巷的门限。而与此同时,官府所使用的高车又给了他们一个示范。为了得到这种通行便利,改造自己的车辆底座也就理所当然地成为一种优势策略。
孙叔赦的做法对我们的启示在于,一个短暂而立竿见影的执法过程,其效果不仅远远胜过无法触动现行习惯的任何行政命令,而且大大高于一个投入同样力量进行的一个长期而温和的执法过程。
任何法规政令,无论它的规定多么严密周详,如果无法严格执行,那么它的存在价值不仅会大打折扣,而且还会产生一种容易被人忽视的负面作用,那就是阻碍更新、更有效的法规的出现。
非正式规则一样重要
在鹰鸽博弈中,我们知道,一旦选择进入某一路径(无论是“好”的还是“坏”的)就可能对这种路径产生依赖。某一路径的既定方向会在以后的发展中得到自我强化。
在现实生活中,人们过去作出的选择决定了他们现在及未来可能的选择。好的路径会起到正反馈的作用,通过惯性和冲力,产生飞轮效应而进入良性循环;不好的路径会起到负反馈的作用,就如厄运循环,可能会被锁定在某种低层次状态下。
亚太经合组织在上海开会期间。中央电视台做了一次访谈节目,一个美国在华女投资人说了一句话:“我们美国人吃香蕉是从尾巴上剥,中国人总是从尖头上剥,差别很大。但没有谁一定要改变谁的必要吧?”
世界上许多事—国家间的大事,人与人之间的小事—许多都与这个“从哪一头吃香蕉”的问题有相似的地方—各持一端,也许都有道理。一个人很难让自己改变剥香蕉的习惯。无论懒惰者还是勤勉者,养金鱼都没有问题。勤勉者可以每天换一次水,懒惰者尽可以一月一换。只是如果突然改变换水的习惯,变一天为一月,或变一月为一天,金鱼都可能莫名其妙地暴毙。勤勉者据此得出结论:金鱼必须一天一换水。懒惰者得出完全相反的结论:金鱼只能一月一换水。
这就如同我们剥香蕉的方式。很多人之所以急于改变,其实是出于一种自卑心理。如果遇到难以进行的改变,我们不妨先试试换个角度去想:它是不是一个香蕉问题?如果是,那么既然香蕉是可以从两头吃的,这种改变又有什么必要呢?
在人们的生活中,存在着种种惯例,也就是哈耶克所说的规范人们社会活动与交往的“未阐明的规则系统”,尽管它不像种种法律法规和规章制度那样是一种成文的、正式的、由第三者强制实施的硬性规则,而只是一种非正式规则,但是它巨大的影响力却是绝对不容忽视的。
共同知识的重要性
在鹰鸽博弈中的路径依赖作用下,人们之间往往存在着一种可以称为惯例的共同知识。这些共同知识能提供给博弈的参与者一些确定的信息,因而它也就能起到节省人们在社会活动中的交易费用的作用。
在现实生活中,最明显的例子是格式合同。格式合同又称标准合同、定型化合同,是指当事人一方预先拟定合同条款,对方只能表示全部同意或者不同意。因此,对于另一方当事人而言,要订立合同,就必须全部接受合同条件。现实生活中的车票、船票、飞机票、保险单、提单等都是格式合同。在进行一项交易时,只要交易双方签了字,就产生了法律效力,也就基本上完成了一项交易活动。
可以想象,如果没有这种标准契约和格式合同,在每次交易活动之前,各交易方均要找律师起草每份合同,并就各种合同的每项条款进行谈判、协商和讨价还价,那么所浪费的不仅仅是金钱还有时间。没有共同知识的博弈,会给整个社会无端增加许多交易成本。
著名相声大师刘宝瑞先生有一个《知县见巡抚》的著名段子,说的就是一个因为缺少共同知识而产生的笑话。
光绪年间,浙江杭州有个茶叶铺,字号叫“大发”。掌柜钱如命深通生财之道,十几年的工夫就开了好几个分号,还在安徽买了座茶山,坐庄收茶,大发其财。可就是有一样:钱掌柜斗大的字不认识两麻袋,是一个大文盲。钱如命的钱越赚越多,就开始觉得当官比做买卖好,又赚钱,又威风。
当时做官有两种途径:一种是科举及第,凭学问和本事考中;另一种是捐班,靠花钱来买官。钱如命斗大的字认不了一箩筐,于是就花八千两银子买了个实缺知县,走马上任。
钱如命做了一年多知县,八千两银子的本儿早已不知翻了几番,官瘾也就越来越大,想弄个知府做做。于是他带着大批银两到省城,托人给巡抚送了一份厚礼,另加一张一万两银子的银票。巡抚一看礼物不轻,当时就派人传唤。钱如命换了身新官衣来到衙门,见了巡抚,行完礼,落了座,差人献茶。
在当时,官场上为客人献茶只是一种形式,客人并不真正喝茶,尤其是当下属拜见上司时,即使面前有一杯茶,也绝对不能喝,当正事说完后,主人会举起茶杯说“请喝茶”,那就是告诉你应该走啦。这时客人会识趣地赶快告辞。因此端茶是一种送客的暗示,这实际上也是官场上的一种共同知识,无须交代。像巡抚这样的官,只要一端起茶碗,底下的差人马上就喊“送客”,你有多重要的事情没谈也得告辞。这个官场规矩叫“端茶送客”。
可是钱如命是茶叶铺掌柜出身,不懂这一套,他心想:他是巡抚,我是知县,应当主动客气。坐了一会儿,他双手捧起茶碗对巡抚说:“大帅,您喝茶!”巡抚听了心里一愣:怎么,你跑到我这儿“端茶送客”来啦?你打算把我轰哪儿去呀!钱如命看巡抚没言语,又奉承了一句:“大帅,您这茶叶真不错,我一尝就知道是地道的西湖龙井!”巡抚心里不高兴,脸上可没露出来。倒不是这位巡抚大人宽宏大量,实在是看在那银票的分上,要不然早就翻脸了。
事实上,在生活交际中,共同知识起着一种须臾不可或缺的作用,只不过我们并没有意识到而已。这虽然是个笑话,但是我们却可以从中了解到,共同知识对于生活于社会上的人们,具有如何重大的意义。
在社会上无处不在的这类共同知识,当然并不仅限于端茶代表送客这样表层的东西,像某些习俗、同业行规、银行信用的使用等等,这些都是共同知识。
除了这些显性的惯例,还有一些隐性的但是心照不宣的惯例,同样在支配着各个领域的社会生活,著名作家吴思将其称为“潜规则”。
打破惯性思维
依据鹰鸽博弈的路径依赖理论,人们一旦作了某种选择,惯性的力量会使这一选择不断自我强化,并在头脑中形成一个根深蒂固的惯性思维。久而久之,在这种惯性思维的支配下,你终将沦为经验的奴隶。
在生活中,我们要学会用创新的思维打破常规,争取开辟出一条与众不同的道路。
一次,一艘远洋海轮不幸触礁,沉没在汪洋大海里,幸存下来的九位船员拼死登上一座孤岛,才得以幸存下来。
但接下来的情形更加糟糕,因为岛上除了石头,还是石头,没有任何可以用来充饥的东西。更要命的是,在烈日的暴晒下,每个人都口渴得冒烟,水成为最珍贵的东西。
尽管四周都是海水,可谁都知道,海水又苦又涩又咸,根本不能用来解渴。现在九个人唯一的生存希望是老天爷下雨或别的过往船只发现他们。
九个人在煎熬中开始了漫长的等待。然而老天没有任何下雨的迹象;天际除了海水还是一望无边的海水,没有任何船只经过这个死一般寂静的岛。渐渐地,他们支撑不下去了。
八个船员相继渴死。当最后一位船员快要渴死的时候,他实在忍受不住了,于是扑进海水里,“咕嘟咕嘟”地喝了一肚子海水。船员喝完海水,一点儿也觉不出海水的苦涩味,相反觉得这海水非常甘甜,非常解渴。他想:也许这是自己渴死前的幻觉吧。于是他便静静地躺在岛上,等着死神的降临。
然而,他一觉醒来,发现自己还活着。惊讶之余,他依靠喝岛边的海水度日,终于等来了救援的船只。
后来人们化验海水时发现,这里由于有地下泉水不断翻涌,所以,海水实际上是可口的泉水。
通常我们都知道,海水是不能饮用的,对此我们已经形成了惯性思维,也就是路径依赖。在路径依赖的影响下,故事中的船员根本没有做任何尝试就认定那里的海水是不能喝的。可是他们临死都不知道那海水其实是清甜可口的泉水。
路径依赖充斥着我们的生活,经验成了我们判断事物的唯一标准,存在的当然变成了合理的。随着知识的积累、经验的丰富,我们变得越来越循规蹈矩,路径依赖已经成为人类同自己的内心进行博弈时的一大障碍。
思维定式是一种人人皆有的思维状态,当它支配我们的常态生活时,似乎有某种“习惯成自然”的便利。但是用僵化和固定的观点认识外界的事物,对我们是有百害而无一利。
《围炉夜话》中指出:“为人循矩度,而不见精神,则登场之傀儡也;做事守章程,而不知权变,则依样之葫芦也。”在人生博弈中,为了做一个心灵自由的人,我们必须打破惯性思维,不要做经验的奴隶。
一个短暂而立竿见影的执法过程,其效果不仅远远胜过无法触动现行习惯的任何行政命令,而且大大高于一个投入同样力量进行的一个长期而温和的执法过程。