从纳什均衡说起
均衡即是平衡的意思,在英文中是叩11出旧皿。在经济学中,均衡即相关量处于稳定值。供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能将商品卖出去,此时我们就说,该商品的供求达到了均衡。此时的价格可称之为均衡价格,产量称之为均衡产量。均衡分析是经济学中的重要分析。
那么,什么是博弈论的均衡呢?所谓博弈均衡它是一稳定博弈的结果。均衡是博弈的一结果,但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,因而是可以预测的。
纳什均衡是一最常见的均衡。客观存在的含义是:在对方策略确定的情况下,每个参与者的策略都是最好的,此时没有人愿意先改变自己的策略。
在上面的买一卖的博弈中,卖出,买进是一纳什均衡,这个博弈可以解释为什么在现实中,讨价还价后买卖能够做成的原因,因为这对双方来说都是最优选择。同时在买一卖博弈中,其均衡对双方来说是全局最优的。
我国研究纳什均衡的专家谢识予博士在《纳什均衡论》中用通俗的话表达了纳什均衡的含义:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。
以上这样一些博弈论中的行话有些难懂,因此,我们再可以用更加通俗的话来解释:
一人要买,另一人要卖,这时候最好的结果是买卖做成功,其中价格是双方谈妥的,大家都能接受的,这就是均衡,要是一家想卖而另一家不买,一家想买而另一家不卖,这就不能叫做均衡了。
一对恋人,女的晚上想去唱卡拉OK,男的晚上想去看足球比赛,但他们正在热恋中,其中还有妥协成就对方意愿的一面,并希望共同度过一个美好的晚上。在这种情况下,无论是一齐去唱卡拉ok还是一齐去看足球,都算作均衡。而为此怄气,各干各的,那就不是均衡了。
均衡其实是当执行这种策略时,双方都认为是满意的一种结果。也就是说是一种平衡的结果。
我们现在不是专门在这一章里讲,纳什均衡,而是有着借用这个词的意思。
我们要说的意思是,任何性质的博弈,其实都是在追求着一种平衡。
让我们就上一章的一些例子去试想一下,一个人上超市买东西,花了299元钱,结果服务小姐拿走了3块钱,他觉得心里不平衡,于是,他去找到工商所投诉,要讲这个理,最后是总经理带着小姐来赔礼道歉,还了这1分钱。他缺这1分钱吗?不缺。而在今天的中国,这1分钱在很多场合下已经是没法使用了。但是这位投诉者就是要讲这个理,如果没有总经理带小姐走这一趟,那他的心里是一直不会平衡的,走了这一趟,道完了歉他甚至说用不着归还这1分钱,他就觉得平衡了。
而那个关公呢,他如果不放曹操,将他抓来了,而且曹操是被诸葛亮处死的,那么他是会终生不安的,因为他觉得他是杀曹操的罪魁祸首,他永远欠下了曹操的一份恩情,现在把曹操放了,虽然他回去会受到诸葛亮的处罚,但他的心里就平衡了,因为他的债还清了。也许,我们人人都在追求着这样两个平衡第一个平衡是事业上的,经济学意义上的。要是我们花出一笔钱去买东西,物有所值就感到平衡,要是买到了一件伪劣商品,或是缺斤少两,或是对方找了你一张假票子,这些都会让我们感到心中不平,有了被欺骗上当的感觉。
要是你自觉得有才,有工作能力,但是上司老是看不上你,你工作做得再好也白搭,干活是你的,升职是别人的,你就会感到不公平,不是对领导有意见,就是觉得老天爷太捉弄人。第二平衡是感情上的,精神层面上的。
就像我们前面说到的那种仇富心理,希望富人、名人甚至自己不喜欢的当官者经常会出点花边新闻,会有朝一日不再红,或者被拉下马来。其实,这些明星、大款与这个人并不认识,也从没有什么经济纠葛和其他矛盾,但这个人心里却始终不平,带着一种嫉妒的心理。许许多多的犯罪者就具有这样一种心态,为什么他能住洋楼坐小车,而我连饭也吃不上,口袋里连10块钱都没有?看着他坐着小车出人洋楼,手挽着那个漂亮的小蜜心中就来气。
江青的例子颇有些这种性质。那个周信芳的夫人其实并没有揭她的丑,也不敢说看不起她。但是江青心里始终有着这样一个情结,过去做过戏子不光彩的情结,这是和今天当主席夫人不相称的,因此她极力掩蔽过去的历史,到了掩耳盗铃的地步,谁提起她的过去她就恨谁,还要给予无情的报复。她的这种报复,也是来自于心里的不平衡。
自然,这两个不平衡有时不是那么可以分割开来的,一是一,二是二,它们是相互地纠缠在一起的。我们可以说它是一种双链绞合状态。一个自认为有李白之才的书生,没有得到上司的重用,这是物质层面上的,同时产生的心里的不平,则又是精神层面上的。而精神层面上的东西,又很快反馈到物质上,他的恃才傲物,他叫高力士脱靴,杨贵妃磨墨的行动,就是心中不平的表现,这种表现也是一种博弈,它将导致不才明主弃,多病故人疏的新结果,离开他想要的目标日趋渐远。
无论是经济上的亏欠与不划算,还是心理上的恩怨情仇的怨天尤人,都是一种不公平、不公正的表现,正是这种不公平或者根本上是他自认为的不公正,在心里引起了不平衡,心中的不平又使这个人产生了想把公平找回来的渴望。这个渴望形成了这个人博弈的动机。
在这个动机推动下,这个人就要开始行动,杀人偿命,欠债还钱,这是行动的动机,也是行动想要达到的目的。但是,由于具体人的知识素养不一,精神道德的高下不一,行动策略也就会有种种差异。甲可能采取了隐忍的办法,乙采取了快意恩仇的办法,而丙呢,却远离了目标一他把报复的矛头引向了社会。比如,这个人男人的失恋是因为那个负心女子抛弃他所致,于是,这个男人就专找年轻漂亮的姑娘,把她们漂亮的脸蛋划破,叫她们难看。这种报复早已离开了他原先负心女子的具体对象了。
凡此种种,都可以归纳到一个问题上来。也就是用一个平衡论便可以解释:作用者的行为,都是因为原来的不平引起了心里的不平,而想要在下一次博弈中找回自己的公平而引发的行动。
记忆的历史
博弈双方,甲与乙。他们可能是两个人,也可能是两个集团。甲在想与乙博弈的时候,他并非是白纸一张,不,他的满脑子里其实都写满了对另一方历史的记忆和历史的经验。
他的一切不平,都是来自于这段历史与这段经验。由于泛泛讨论甚为困难,现在我们假设这个乙是甲的领导。甲与之打交道不下数次,假设为6次。那么,在甲的头脑里,便有了这6次的记忆。
第一次,乙还是刚来公司上任,去向他请示工作,还算客气,但觉得这个人有些滑头。
第二次,因工作出错,挨了他在中层干部会上的批评,但事后又留下甲好言安慰了几句,让人觉得他打人一巴掌,再抚摸你两把有些手段。
第三次,单位分房,打分排队看似公正,但继后有人告诉甲,排在最前面的那个女的与领导的关系不正常;还有一个是他的司机,本来排不上队的,硬让他加塞儿。故而,甲只分到了较差的房子,本来他是可以再往前排的。
第四次,由于乙领导在这个单位时间长了,开始暴露了他贪婪的本性,经常出国游,任人唯亲,晚上还经常开车出去冼桑拿、泡脚、唱卡拉0、他不再注意自己的形象了。甲有次快下班时找他汇报工作,他却对着电话说个没完没了,电话里是一个年轻女人的声音。后来乙急于出去是否想与那个女人约会,汇报变得有头无尾。
第五次,单位规定是50岁退休,满30年的可以拿工资的90%,不满的只能拿80%,单位先前的规定是如果只有29年多,最后一年超过6个月的按一年算,他却非要实行满12个月,一个月都不能差,因此甲正好被他这条杠杠卡住了,只能拿80。
第六次,甲有一次生了大病,住院花了45万元,按照过去规定,单位在2000元以内可以报销80,超过部分可以报销50%。但是由于甲生的是一种特殊的病,这种病只能是某某医院有专科,他去看了,但不是单位指定的医院,所以连50%都报不了,甲的妻子曾找过这位领导数次,他总是打官腔,不办事。
那么,这六次的接触乙领导给这甲的印象如何呢?假定印象评级是好、一般、差、极差四个档次不管事情的对错与外界如何评价,反正甲会给这位领导打出自己的印象分来的。那就是:
第一次,一般
第二次,一般
第三次,差
第四次,差
第五次,极差
第六次,极差
这就是甲对于这位乙领导的记忆。如果他们再发生第七次的往来,这位甲肯定会说:我再也不会去找他了,找也白找!他呀,只顾他自己的利益,哪管工人的死活?
以上的情况虽然是一个假设,但我们同许许多多的人打交道,不就是凭着这样的印象与记忆吗?
这就是我们留在大脑里的印象示意图,中间挑起一个浪花的地方是刺激最深刻的那一次。
一般的规律是,不管你与博弈对象交手几次,后几次总是比前几次的记忆深刻,再就是恩怨最刺激激动最烈的那一次印象也最深刻。
不久前,北京郊区发生了一桩怪事,一位中年男子离婚14年,始终把他的老班长当成了假想敌,再次当街见面,就将老班长杀死,成为刑事案中的一桩奇闻。
这个男子叫严贵虎,他在1989年与结婚4年的老婆离婚。离婚后,他一直怀疑老婆是因为与自己的同事老班长孙某人有暧昧关系所至,因此一直怀恨在心。离婚后他调往三家店某单位工作,每天下班后的生活相当单调乏味。他把自己关在家中,用写日记的方式发泄着心中的愤恨,回忆着家破人亡的经过。这个现年40岁的严贵虎离婚后曾有过两次自杀未遂的经历,这让他更加沉默寡言,对情感生活更加失望。
2003年4月20日,上午10时30分左右,严贵虎到丰台杜家坎一市场买烟,在杜家坎环岛西北角附近恰巧碰到了开着蓝色奥托汽车的老班长孙某。正在趴活儿的孙某主动与严贵虎打招呼:虎子,回家吗?我送你一段路。听到孙某的招呼,严贵虎认为对方是嘲笑他,冲动之下竟然从随身携带的蓝布提兜里掏出一把20多厘米长的上首,向坐在车内的孙某脸部、颈部等部位猛剌数刀,将49岁的孙某扎死。随后严贵虎到长辛店派出所自首。
上午11时许,严贵虎被辖区的卢沟桥派出所民警和侦察员接回派出所后,对侦察员说:我本不想这样做,但我不能克服仇恨与嫉妒这两个人类最大的心理弱点,所以我才出此下策的。
当然,从孙某人的角度来想,恐怕想破脑袋也想不通,因为他根本没有与严贵虎的老婆发生什么关系,这完全是严贵虎偏执性思维设在严贵虎的行为里,没有什么策略需要研究,如果说有策略,那是他14年里朝思暮想早就想好了的。他把离婚之过归罪于这位老班长,时刻想到要报仇。这就是他的记忆在起作用,而不是什么策略在起作用。正是因为有了这个记忆,有了他的老班长是他婚姻中情敌的结论,因此一见面就下了手,让对方连防备的意识都没有就命丧刀下。
还有一点是,严贵虎因为有了前一次的记忆,所以对这一次的相遇也有了先入为主的看法,老班长只说了声用车送他一段路,这本是好意,他就以为这是看不起他,讽刺他了,如果没有前面的这样一段历史的记忆,这样一句平常普通的话是无论如何也不会产生那样的想出来的,在他的头脑里还一直把严贵虎当成他的老部下,所以才客气地打一声招呼,哪知就是这声招呼让他命归黄泉。
因此,在这里要说一句话是:如果你与你的对手有过交手的历史,那么,一定要总结这一段历史,了解对手对你的看法,从而设想对策。我们在这里已提到过数次,诸葛亮利用了自己一生惟谨慎的历史一一不仅是司马懿如此认为,一般与之打过交道的部下和敌手都这样认为,因此才敢于在司马懿的十余万人马兵临城下时玩了一个空城计的游戏。如果没有前面与司马懿的多次交手,诸葛亮绝不敢用,用了司马懿也不会相信。
这样,一个新的结论得出来了,在博弈中,当你与同你交手的参与者见了面之后,研究策略固然重要,研究历史同样重要,这就叫历史的经验不可忘记。
在记忆这段历史之中,似乎有着这样一个过程不可忽略,第一是你与对手有着几次的交手经历,这些都是感性的认识,第二点是在感性认识不断积累之时和之后,你开始建立起来的综合性认识,并从这综合性认识中得出来的结论性判断。
其实,到了新的一次交手时,我们直接使用的并不是对对手的感性认识,而是使用判断,这个判断十分简略,一句话,或者在脑子里一闪之下便可完成,这家伙胆子小、他也太不讲义气了、这个人不可靠、行,有骨气,有种、他脑袋瓜蛮活的、小心,他是个口蜜腹剑的人,如此等等,那就是把多次的复杂历史化成了最简单的综合,我们最后就是利用这种综合判断来确定自己对策的。这种确定与我们的对策之间有时会快到什么程度呢?
这就像高明的乒乓球运动员与对手打球:1甲判断乙在以往发球时喜欢做假动作;2乙这次发球把动作做得很夸张,其实也是一个假动作;3现在这次发球肯定不是长球乙做了一个发长球的动作,而是短球。我必须用接短球的办法去接。这样一个过程,就会在不到1秒钟的瞬间里完成了。
这里面的关键是把许多感性认识综合起来,形成判断,这是一个升华跳跃的过程,在这个过程中,我们很可能产生失误。是智者还是愚者,是善于总结者还是断章取义者,全取决于这里面的功夫。上面提到了那个严贵虎,就是综合错了,判断错了而形成的悲剧。因为他的离婚,很可能是他的老婆认识到了他许多不可容忍的缺陷不得已而离之,非孙某什么事,正是由于严某的判断错误,孙某成了替死鬼,而他也面临杀人偿命的后果。
一切的行为策略都是为了求得平衡
上一次做买卖吃了大亏,这次把亏损找回来;上一次领导让我穿了小鞋,这次还是那样,我就让他难看;小时候我没饭吃时他曾经照顾了我,现在我咨了也得给他补偿。……人类的许多活动,都是在这样的指导思想下进行的,不说全部,起码也是绝大部分。
一句话,一切的博弈都是为了求得平衡,收支的平衡与心灵的平。只有在不平衡的时候,人类才有行为的动力,不平衡的现象愈严重,行为的动力也就愈大。
因此,所谓的纳什均衡就是纳什平衡,就是博弈双方都想追求的一种平衡结果。