博弈论也叫“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学,经济学,国际关系,计算机科学, 政治学,军事战略和其他很多学科都有广泛的应用。主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
博弈就是个人或组织在一定的环境条件与既定的规则下,同时或先后,仅仅一次或是进行多次地选择策略并实施,从而得到某种结果的过程。我们生活在这个世界上,就不可避免地要与他人打交道,这是一个利益交换的过程,也就不可避免地要面对各种矛盾和冲突。
“囚徒困境”的故事
囚徒困境是一种非合作博弈,它的主旨为,囚徒们虽然彼此合作,坚决不吐实情,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,出卖同伙可为自己带来利益(缩短刑期),而被同伙招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。
囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人的最佳选择并非是团体的最佳选择。
1950年,就职于兰德公司的梅里尔·弗勒德和梅尔文·德雷希尔拟定出相关困境的理论,后来由顾问艾伯特·塔克以“囚徒”方式阐述,并命名为“囚徒困境”。那么,囚徒困境的案例究竟是怎样的呢?
警方破获了一起纵火案,抓住了两名嫌疑犯甲和乙,但是没有足够的直接证据来指控二人入罪。于是,警方分开囚禁两名嫌疑人,分别对他们进行了讯问。为了瓦解分化对方,警方分别对两名嫌疑人说:如果主动坦白,可以减轻处罚;如果顽抗到底,一旦同伙招供,就要受到严惩。
如果两人都拒不坦白,那最后警方会以扰乱社会治安、破坏公共安全的罪名将二人各判刑1年;如果其中一人认罪并作证检控对方,此人将作为证人而免于起诉,而保持沉默的另一人将被重判15年;如果两人都招供,则两人都会因纵火罪被各判10年。
面对这样的情况,甲乙两名嫌疑犯在各自的心里打起了小算盘。甲经过权衡后发现,只有自己招供是最佳的选择,可以获得自由;乙也发现,无论甲招不招供,自己的最佳选择都是招供。所以,最后的结果是,甲乙二人都分别向警方坦白了自己的罪行,甲乙两个自认为聪明的人分别被判刑10年。
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
从这个角度出发,上面故事中的两名嫌疑犯自然会选择刑期最短的策略。而由于两名囚徒隔绝监禁,并不知道对方的最终的决策;即使他们能交谈,也未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得的刑期,总比自己沉默要来得低。二人面对的情况一样,所以二人的理性思考都会得出相同的结论--选择背叛,结果二人同样获刑10年。
因为双方都认为选择背叛自己最得利,所以根本不会去顾及团体利益。而以全体利益而言,如果两个人都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑10年的情况更好。但根据以上的假设,二人均为理性的个人,且只追求自己的个人利益。均衡状况会使两个囚徒都选择背叛,结果二人获刑均比合作要高,总体利益较合作为低。这就是“困境”所在。在日常生活中,有很多这样的“困境”存在。
有一则三个老鼠偷油的寓言故事:
三只老鼠一同去偷油喝。到了油缸边一看:油缸里的油只有那么一点点,并且缸身太高,谁也喝不到。
于是它们想出办法,一个咬着另一个的尾巴,吊下去喝。第一只喝饱了,上来,再吊第二只下去喝……并且发誓,谁也不许存半点私心。
第一只老鼠最先吊下去喝,它在下面想:“油只有这么一点点,今天总算我幸运,可以喝一个饱。”
第二只老鼠在中间想:“下面的油是有限的,假如让它喝完了,我还有什么可喝的呢?还是放了它,自己跳下去喝吧!”
第三只老鼠在上面缸边想:“油很少,等它俩喝饱,还有我的份吗?不如早点放了它们,自己跳下去喝吧!”
于是,第二只放了第一只的尾巴,第三只放了第二只的尾巴,都只管自己抢先跳下去。
结果它们都落在油缸里,永远逃不出来了。
还有“鹬蚌相争渔翁得利”的故事,也说明了这一点。
一只河蚌张开蚌壳,在河滩上晒太阳。有只鹬鸟,从河蚌身边走过,就伸嘴去啄河蚌的肉。河蚌急忙把两片壳合上,把鹬鸟的嘴紧紧地钳住。鹬鸟用尽力气,怎么也拔不出嘴来。河蚌也因此脱不了身,不能回到河里去了。河蚌和鹬鸟就争吵了起来。鹬鸟瓮声瓮气地说:“一天、两天不下雨,没有了水,回不了河里,你总是要死的!”河蚌也瓮声瓮气地说:“假如我不放你,一天、两天之后,你的嘴拔不出去,你也别想活,总要饿死!”河蚌和鹬鸟吵个不停,谁也不让谁。这时,恰好有个打渔的人从那里走过,就把它们两个一起捉去了。
从“囚徒困境”模式中,我们可以看到,在这个模式中,理性的人最后的选择都是“背叛”,不通过合作的方式和其他人共同摆脱困境。而在现实中,背叛和合作是共同存在的,而且各方之间的信息也并非都是完全闭塞的。
在博弈中,当你做决策的时候,你身边的人也在做着某种决策,而且是会相互影响的。这个时候,互相之间的利益就可能发生冲突,当然其中也包含着一定的合作因素。因此,你的决策就必须要将这些冲突考虑在内,同时要注意发挥合作因素的作用。
事实上,在具体的现实中,合作还是背叛,处于弱势者的选择并不是固定的,不过尽可能减少损失,让自己得利,这是不变的原则。
博弈课堂:
1.你的选择和决定将会影响到别人的决策结果,同样别人的选择和决定也直接影响着你的决策结果。
2.人们只希望自己的行为对自己无害,并不想是否对他人有利,这种心理是典型的“背叛策略”。
三个和尚没水吃
一个和尚挑水吃,两个和尚抬水吃,三个和尚没水吃。这是很多儿童都熟知的古代故事。那为什么和尚越多,反而越没有水吃了呢?原因就在于三个和尚陷入了囚徒困境,都是从自己最大利益的角度考虑问题,这就是“非合作性博弈”的典型模式。
美国马里兰大学的门瑟·奥尔森教授作为公共选择理论的主要奠基者,无疑是当代最有影响力的经济学家之一。奥尔森最独特之处,在于他对研究集体行动问题的执著。他的代表作《集体行动的逻辑》,就是这方面研究的集大成之作。
在《集体行动的逻辑》出版以前,社会科学家往往想当然地假设:一个具有共同利益的群体一定会为实现共同利益采取集体行动。譬如:住在同一栋楼里的邻居会提供公共楼道的照明;同一社区的人们会保持公共环境卫生;持同一公司股票的人会齐心协力扶持该股票的价格;消费者会组织起来与售卖伪劣产品的商家作斗争;同一国家的国民会支持本国货币的坚挺;全世界无产者会联合起来反对资本家的剥削,等等。
但是,奥尔森通过研究发现,这个貌似合理的假设并不能很好地解释和预测集体行动的结果,许多合乎集体利益的集体行动并没有产生。相反的,个人自发的自利行为往往导致对集体不利、甚至极其有害的结果。
因为,集体行动的成果具有公共性,所有集体的成员都能从中受益,包括那些没有分担集体行动成本的成员。而这些没有分担集体行动成本的成员采取的就是搭便车的行为。例如,“滥竽充数”的南郭先生不会吹竽,却混进了宫廷乐队。虽然他实际上没有参加乐队合奏这样一个“集体行动”,但表演时毫不费力的装模作样仍然使他得以分享“国王奖赏”这个集体行动的成果。
也就是说,当集体人数较少时,集体行动比较容易产生。然而,随着集体人数的增大,产生集体行动就越来越困难。因为在人数众多的大集体内,要通过协商解决如何分担集体行动的成本是十分不容易的。而且人数越多,人均收益就相应减少,搭便车的动机便越强烈,搭便车的行为也越难被发现。
寺庙是佛教徒的公产,是生活在其中的和尚们的共有财产。当只有一个和尚时,自然不存在产权不清、交易成本等问题,而且从自身的需要出发,自己挑水吃是必然的举动。另一方面,他的全部劳动成果“水”的享用者或占有者也只有他自己。他可随心所欲地支配和消费水的原因,用经济学的术语来说就是其生产性行为和消费性活动具有完全的排他性。
当有两个和尚的时候,假定他们都追求自我利益最大化--付出愈少愈好,而收获则多多益善的人,那么他们其中的任何一个都不愿看到别人“搭”自己努力的“便车”,坐享其成,同时又都在想方设法搭别人的便车。在这种情况下,要想解决吃水问题,他们就必然会在轮流挑水、水的消费量,以及在协议执行和违约制裁等问题上讨价还价,并最终达成协议。显而易见,在达成协议、监督其执行和对违约者进行制裁的过程中,是要花费一定量的时间和精力--也就是经济学家的所谓交易成本的一种。而在这种情况下,两个和尚的生产性行为和消费性活动的排他性受到了限制。同时,交易成本可能相对巨大,在工具的限制下(这一点十分重要),他们两人就很可能去寻求其他更为简便和经济的合作方案--两人用扁担抬水。
当有三个和尚时,问题就发生了大的变化。由于工具的特点--扁担和木桶--所决定的,或一个人挑水或两人抬水,在每一次“生产活动”中必然会出现搭便车者。而考虑到他们三人又都是趋利避害的人,其最终不欢而散的结局也就可想而知了。“三个和尚没水吃”就是三个和尚陷入“囚徒困境”的必然结局。
当处于困境时,各方都不知道别人的选择,因而只能猜测,从自己的利益出发去作出选择;他们与困境之间,是一种不可逆转的关系,即他们无法通过自己的力量去左右局势,只能在困境的局势下想办法尽可能让自己的损失最小,获益最大。
一旦陷入“囚徒困境”,其中任何一方都无法独善其身,即使双方都有合作的意愿,也很难达成合作。
那么,三个和尚就真的只能坐等渴死吗?当然不是,只要制定相应的、行之有效的制度,就能够确保每个人都有水喝。
有两种可供选择的方案:
方案一:三人各自在三天内轮流值日挑水,或轮流每两人每天值班抬水。这样,至少在理论上三个和尚是不吃亏的。但事实上,依然不能杜绝搭便车的现象。比如:某些随机事件(如天气变化和疾病侵身等)和客观事实(如每人的身体条件上的差异及消费品的不同,以及道路状况等)都可能导致他们之间的合作破裂。
要使这个方案行之有效,还须确立一系列处理随机事件的附加条款,如某人生病时他人的替代及在雨天或雪天挑水的补偿等等。同时,还要有惩罚机制,比如有人偷懒时,就要加以惩罚。另外,为了防止规则或协议被破坏,必要的监督也是必不可少的。
方案二:三个和尚通过协商招聘一名方丈。由于这名方丈是三个人都认可的,那么就可以让方丈来指派谁、以及用什么方式运水。因为方丈和和尚之间的上下级地位差异可确保安排可以迅速达到效果,尽管这种安排不一定完全公平。
博弈课堂:
1.一旦陷入“囚徒困境”,其中任何一方都无法独善其身,即使双方都有合作的意愿,也很难达成合作。
2.破解困境的方法之一,就是要有制度的约束。
“旅行者困境”:从100到0
“旅行者困境”和“囚徒困境”一样,是博弈论中基本的模型,也是“非合作性博弈”的典型模式。简言之,这一模式代表了处于相同困境状态下,不同的人面对同样的几种选择,最后必将背叛其他人,作出最利于自己的选择的一种情况。
会下象棋的人都知道,每出一子的时候,你还要想到对方的对策,同时还要考虑之后两步、三步、四步……为了赢棋,你不但要自己想出最佳的策略,还要考虑对方的想法。同样的,对方在出子时也会考虑你的想法,所以,你还得想到对方在想你的想法,对方当然也知道你想到了他在想你的想法。这就是所谓的“你知道我知道你知道我知道……”的博弈循环。
也就是说,人们在面对问题和一个个具体情境的时候,都不是盲动的、莽撞的、没头脑的,而是能够在选择策略的时候有明确的目标,就是使自己的利益最大化。
1994年,考希克·巴苏教授提出了旅行者困境这样一种非零和博弈的理论。
两位旅行者坐同一航班从同一个盛产精美手工艺品的旅游胜地返回。在机场提取行李时,发现旅行包内的手工艺品损坏了。两位乘客于是都向航空公司提出了索赔100美元。
航空公司大概了解这种手工艺品的价格在八九十美元左右,但是不知道两位乘客购买时的具体价位是多少。于是,航空公司将两位乘客分开以避免两人合谋,分别让他们写下手工艺品的价值,其金额要不低于2美元,并且不高于100美元。同时还告诉两人:如果两个数字是一样的,那么会被认为是其真实价值,他们就能获得相应金额的赔偿。如果数字不一样,较小的会被认为是真实价值,而两人在获得这个金额的同时有相应的奖赏和惩罚:写下较小金额的会获得2美元额外的奖励,较大的会有2美元的惩罚。
就为了获得最大的赔偿而言,两个人最好的策略是都写100美元,这样两个人就都能够获得100美元的赔偿了。
但是,事实上是两个人都想得到比对方更多的赔偿,于是各自下功夫揣摩对方的想法。甲很“聪明”,他想:如果我少写1美元变成99美元,而乙会写100美元,这样加上2美元的奖励,我就能得到101美元。所以,他准备写99美元。
乙比甲还“聪明”,他想到甲可能会写99美元,那自己也不能吃亏,于是就准备写98美元。
没想到的是,甲考虑得更远一些,计算出乙要写98美元来坑自己,于是他准备写97美元……
结果是,航空公司获得了最大的利益。
博弈论的基本预设是:人都是理性的。在这个索赔案例中,两个人都“彻底理性”和“聪明绝顶”,都能看透十几步甚至几十步上百步,那么上面那样“精明比赛”的结果,最后落到每个人都只写一两元的地步。
这个案例警示人们:一方面,它启示人们在为私利考虑的时候不要太“精明”,告诫人们精明不等于高明,太精明往往会坏事;另一方面,它对理性行为假设的适用性提出了警告。
生活中,“聪明反被聪明误”的事例很多。