34201000000006

第6章点击博弈论关键词

博弈论的关键词很多，有囚徒困境、重复博弈、智猪博弈、猎鹿博弈、枪手博弈、酒吧博弈、人质困境、以牙还牙、人质困境、信息均衡、脏脸博弈、鹰鸽博弈、分蛋糕博弈、蜈蚣博弈、协和谬误、斗鸡博弈、警察与小偷等等。下面做一些简明的解释，一目了然。

囚徒困境：这个简单的例子，几乎是博弈论的代名词。两个基于“坦白从宽，抗拒从严”审讯的囚徒，从理性的角度出发，会产生怎样的结局？结果若是，从个人理性并追求个人利益最大化，那么二人皆坦白，也就是背叛。这在四种策略中并不占优，那为什么不采用集体最有策略呢而合作。很简单集体的优化，必然侵害个人利益的最大化。当然这一切前提是理性假设，也就是著名的经济人假设：经济学中的人都是“小人”（管理学则认为人是“君子”，有意思而有道理的比喻）。破解这一困境的途径则是打破信息孤立，而执法者的反制则是维持孤立或者加强威胁。无论背叛还是合作，谁在这里面坚持到最后，谁将取胜。

重复博弈：囚徒困境，砸了传统经济学的场子。因为个人的自利行为，并不一定导致集体利益的最大化，“看不见的手”拉不住，人类向堕落之城下滑的趋势，难道这真是一个悲哀？索性并非如此，撇去博弈论的理性假设不说。博弈论者很快发现囚徒困境只在单次博弈情形下明显，一旦博弈的开始陷入重复，合作将到来。因为，未来的收益将左右目前的决策。

以牙还牙：重复的博弈理论上导致了合作的产生，但是谁也不能保证合作的继续，因为之前已经说过，合作的代价是建立在损害个人利益基础之上的。如果个人放弃未来收益或当前背叛收益大于未来收益，背叛的风险仍然存在。那么在重复博弈中怎样的策略才是最优。若干睿智而复杂在经过计算机中PK之后，极其原始的“以牙换牙”策略脱颖而出，固然这个策略简单至极，其威力却无穷，以至于人们在短暂的欣喜之后，发现这把太阿指之剑倒持的可怕，一旦重复链条中出现一次（也许不经意的）背叛，那据此原则行事的博弈将永无止境的背叛下去，个人利益极度膨胀的同时，集体利益无限衰微。幸好，这个世界不是模型，也不是如此简单。很多时候，我们不必以牙还牙，第三方的规范：道德与法律就是我们的假牙，他们更加有利、有理、有节。

人质困境：一场憋屈的博弈。抢打出头鸟，人质联合固然可以制服歹徒，但是谁愿出头。这一点给了无数处于劫持者地位的一方以机会，类似于秦的远交近攻、各个击破的策略，将最终全盘赢下。人质可有反制的策略，当然有，不过艰难至极。人质可以选择沉默，这样他有一定时间苟延残喘；或者联合劫持者对付人质，结局还是取决于劫持者，万一他过河拆桥怎么办；同时反抗，集体将获得左右策略，但是这需要壮士断腕的勇气，部分人可能因此受伤。这里是实力与勇气的较量，而且实力暂居上风。

酒吧博弈：如果人人理性，那么每一天到达酒吧的人数将是差不多正好的，但是人非圣贤，往往是有限理性的。第一次到酒吧的人多，那么大多人人认为酒吧人太多，太挤。第二次决定的时候，参考前次而不去酒吧。少数去的人发现酒吧的人第二天很少，感觉很爽，第三次将继续回来，并重新带回许多人……循环就此开始。酒吧博弈一方面显示，现实的博弈参与者，是极其有限理性的，其理性只前延后伸一小段。历史数据只对计算机有用，对人，则不一定。

另一个方面，酒吧博弈指出，胜利者永远只是少数。尽管酒吧存在调谐的可能，譬如发短信时时提醒，但成本恐怕太高。而在其他场合，少数派可能更加会设置种种障碍阻止后进者的上升。也就是说，我们的世界仍然是操弄在少数派的手中。不过，总算这个世界不是模型，少数派的道路到底还是有迹可循的。老练的将军仍旧会在八卦迷阵中找到唯一的生门。若你想要，必须做一个更加老练的将军。

枪手博弈：王者的悲哀。三人对枪自决，甲乙丙枪法优劣递减。最后无奈而神奇的结局，将不取决于同时开枪还是先后开枪，最优良的枪手，倒下的概率将最高；而最蹩脚的枪手，存活的希望却最大。因为没有人会把威胁最小的枪手列为一号清楚目标。在这里，后发制人的弱势者将胜出。以弱胜强，绝不是神话。

难道王者的命运就真如此不堪，呵，道别忘了每个理论模型都是有其前提的，击破之中任何一个，王者仍将归来。这就是先发优势。假设这是一场类似CS的竞技，优秀的枪手击倒二号枪手，立刻获得奖励：盾牌。那么三号枪手将陷入绝境。不过，不管怎样，这个博弈模型，到底给了弱势者一份希望。机会永远存在。

猎鹿博弈：两个猎人合作猎鹿获得的收益将远大于分别猎兔的收益，战略联盟将开始。这或许是件好事，不过有取决于最后猎获的鹿——这一公共资源的分配，如果分配得当，整体的效率将增加。如果一方主导，另一方受损，那么帕累托改善无法进行，合作可能终将破裂。

另外一个问题，更加大局的问题。合作的示范性将使得更多的猎人加入，猎获的鹿将大大增加，人类的利益短期内将呈几何级数增长。但是最后，确是生态失衡，鹿群灭群。短暂的繁华之后，猎人将再一次回归于原始猎兔生活。尽管为了避免这一悲剧，人类还有最后的希望：制度经济学的法宝——科斯定理以产权归属来解决外部经济问题。但由于谈判成本以及可行性，人类社会的公共悲剧仍将不断上演。

智猪博弈：混沌之前最后的博弈。小猪和大猪住在猪圈的一边（食槽在这里），开启食物的开关在另一头，谁去踩，谁丧失先机。结果怎样？是小猪选择“搭便车”，大猪勤跑。因为小猪无论跑还是停，大猪的最优策略都是策略都是去踩机关。不过在实际生活中。这里依旧存在两种策略。

小猪的“搭便车”。大猪有的时候，自觉或不自觉地自封“侠之大者，为国为民”，并因此承受一些不能承受之重。《博弈论的诡计》指出美国战后的行为极似大猪，战后的美国竭力宣传自己的普世价值观，并深入到海外事务，甚至不惜重金协助小国防务。这样小国不自觉地对大国进行了“剥削”。

大猪在击破模型的一个假设之后，仍然有一个后发制人的机会。因为大猪和小猪的耐饿能力不一样，大猪完全有能力撑得更久，小猪如果不想饿死，那只有一条豪赌的路子：龟兔赛跑式的豪赌，但愿大猪打了个盹儿，他回来的时候，还能吃上一两口，要不然真是赔了夫人又折兵了。据此，再也不难解释为什么很多人切齿的腾讯，毫无顾忌地跟风，做QQ旋风，做拍拍，做滔滔。因为不甘心的小猪早早把新技术研发的前期搞定了，大猪们只需要悄悄跟随，适当的时候踢开挡路的，就可以了。

大猪在这里的后发制人和枪手博弈的后发并不一致，枪手后发是建立在他人恶斗的基础上，大猪后发完全是以自身实力为基础。而且大猪完全不必采取任何激进措施，只要跟随就好。因为小猪获胜的条件不是接近，还是距离。

警察与小偷：令人沮丧的博弈结局。警察和小偷各只有一个机会去巡查或者偷盗A地或B地。A地的价值大于B地，那么警察应该为了保护价值大而一直保护A地吗。博弈论认为当然不是，警察的合理策略应当是有倾向于A以一定概率的随机巡查。这个概率就是：p

A地价值/AB地总价值。这种情况下才能使小偷最大得手几率降至最低。但是很不幸的是，此时的小偷谋求的是，最小得手几率的最大化。也就是说，警察的最优策略将把小偷的最差策略改良！这个便是冯·诺伊曼提出的“最小最大定律”。

我们必须再一次感谢这个不完美的世界，因为现实之中，类似的现象，对于一方仍然可以设法找到对手致命的规律性行动（当然必须考虑到对方是不是一个更加老练的猎手，故意放出的诱饵）。而保持自己的行动的无序性，则有可能成为欺骗策略的武器，这倒似张三丰所言道的：无招胜有招。

斗鸡博弈：两只斗鸡在决斗的时候，无论选择进或退都是一个难题，因为纳什均衡已经给出了一胜一败的最优策略。在很多较量下，死拼将是得不偿失的，因为很可能给第三者机会。因此，两个已经在战场的强势力很可能自觉的遵循纳什均衡，当一方攻击时，另一方暂退。虽然可能某方暂时受损，但较之于两败俱伤是好得多的。不过，要维持这一状况，必须保证下一次先期受损的一方发动攻势的时候，另一方同样的后退。于是这样的攻击性行为开始变得“仪式化”，没有人真正流血。这只不过是两个巨头玩弄的游戏，目的是警告后来者，想进来，那么也得陪我们一起玩，可是你玩的起么？这正是百事的广告，即使暗含挑衅也最多只到“敢为中国红”这样的地步的原因。

协和谬误：欧洲政府在大量投资协和飞机后，终于不能自拔。即使前景黯淡，也撑着面子投下去，非要走头无路才放弃。而这时投入的成本已经全打水漂了。如果，发现不能继续的时候，就果敢放手，损失会小得多。可是他们会、能这么做么？壮士断腕，是何等的壮烈，却也是何等的艰难！

沉没成本很可能会延续人们无畏的坚持。已经沉没的本该放弃，可惜大部分有赌徒式的心理，相信阿基米德的杠杆终将启动。可惜他们在爬到足够撬动杠杆的支点之前，已经窒息了。

协和谬误，倒是给了人们半途而废的理由，会不会有人担心它的滥觞会左右一些本该坚持的目标？的确有这个可能，但是应该相信人们足够理智，完全可以比较沉没成本、机会成本与未来收益的关系。看清了的，必定会坦然地走出协和谬误。

蜈蚣博弈：一场颠前倒后的博弈。蜈蚣博弈的机理是以最终的结果倒退至开始。这是一个睿智的策略，因果相报，把握好因缘，自有好结果。它的另一个好处，就是使得未来的计划明晰化，是你不再徘徊。只可惜，很多时候，碌碌无为的我们并没有看透迷局的眼睛。我们黑色的眼睛只习惯于黑夜。

蜈蚣博弈也有一个致命的悖论，仍旧是个人利益和集体利益的冲突，因为最后一次的背叛收益始终优于合作。可悲的是，这一次背叛将由于人性的理智，穿越时光隧道，回到原始的地点：人们将从开始就拒绝合作。还是感谢我们这个不完美的世界吧，事实上人们很少这样做。当然合作到最后的也很少，这意味着，倒推法只在中间阶段突然发生了作用，只不过谁也不能预测，中间一步在哪里。在那里，我们只有冀望信任、道德、良知等等。

分蛋糕博弈：两个小孩怎么分蛋糕？经典的故事，经典的解答：一个分，一个选。现实多如此，权利的合理分配将有效促进公平与效率。经营权与所有权的分置的确使得经济更加活力。不过分蛋糕的进阶模型却强调了讨价还价的策略，分蛋糕不是一次性的，而是多回合的，而且出现成本：蛋糕在融化。

时间称本的加入，将使得分配变得复杂化。双方如果不能及时达成交易，不仅集体的收益将减量，而且个体的收益也将减少。在此情况下，利用时间称本以及威胁、承诺将对其中一方极其有利。顾客可能迫于情势，必须尽快结束谈判，这时卖方却不慌不忙，故意拖延，顾客一方将不得不在价格上作出妥协。

顾客一方当然也有策略，它的策略就是货比三家，要求承诺或威胁。这个前提是买方市场的存在。顾客还应当保护自己讨价还价的能力，这就是顾客有权投诉商家。

鹰鸽博弈：这个博弈很多人等同于斗鸡博弈。不过，斗鸡是两个兼具侵略性的个体，鹰鸽却是两个不同群体的博弈，一个和平，一个侵略。在只有鸽子一个苞谷场里，突然加入的鹰将大大获益，并吸引同伴加入。但结果不是鹰将鸽逐出苞谷场，而是一定比例共存，因为鹰群增加一只鹰的边际收益趋零时（鹰群发生内斗），均衡将到来。

由此产生了ESS进化上的稳定策略，也就是说一旦均衡形成，偏离的运动会受到自然选择的打击。也就是鹰群饱满后，再试图加入的鹰将会被鹰群排挤。

进化上的稳定均衡最大的好处莫过于保持稳定。但问题在于形成强势的路径依赖，也就是胜出的不一定是最好的。因为最好的会被当作出头鸟干掉，这是个体的失败，集团的胜利以及集体的止步不前。

脏脸博弈：恍然大悟的博弈。三个人在屋子里，不许说话。美女进来说：你们当中至少一个人脸是脏的。三人环看，没有反应。美女又说：你们知道吗？三人再看，顿悟，脸都红了。为什么？因为美女后一句废话点破天机，三个人都知道脏脸的存在，而且推测知道对方也知道了脏脸的存在（因为另两人脸没红，说明他们看到脏脸了），而且知道对方知道自己已经想到上一步……循环开始，知识开始共同化，真相大白：三个人都是脏脸，所有人都脸红了。

这就是共同知识的作用，它的作用显得有点可怕的强大。几乎是一招无影腿，杀人不见血。在台面上的博弈之前，私下的算计已经置对手于死地。不过，很可能对方也预料到这一点，早也想到这一点，同时杀来。终于，形成双死局面。

当然，现实虽然存在类似现象，不过共同知识更大的作用在于减少交易成本。因为某些规则人尽皆知，双方只要各自依之行事就可以了。

信息均衡：很想然，信息的作用在博弈之中非常重要。将博弈论还原到现实，人们不再完全理性，信息存在不对称，博弈就需要在抢占信息高地上作出努力。

信息不对称，是一个很大的障碍。信息的不对称会造成“逆向选择”和“道德风险”，前者事前，后者事后。信息不对称短期内对某一方会有利，但最终会破坏整个市场。于是有两个解决策略。

信息传递：传达你的正面的信息的策略，也就是说吸引顾客走到你的柜台面前。它的要点是保持有效、减低成本。

信息甄别：诱导对手暴露其私下拥有的真实信息。就是给顾客一个放大镜，保证顾客不会走到其他柜台去。这种策略显然更加有效，不过风险也更大：万一顾客用放大镜看出了了自己的瑕疵怎么办？

第6章 点击博弈论关键词

第6章点击博弈论关键词