第2章走近博弈论，拥有好生活

博弈游戏：一场游戏一场梦

对于不熟悉经济学和数学的人来说，“博弈论”听起来似乎高深莫测，其实它的英文表示是“gametheory”，直译就是“游戏理论”。而意译的“博弈”同样是在说一种游戏，“弈”在古汉语中是“围棋”的意思。

生活就像一个棋局，我们每个人都是棋手，所做出的每一个行为都像是在生活这个抽象的棋盘上布一个子。每个下棋的人都揣测着对方、约束着对方，争取得到最后的胜利，在这个争夺中呈现精彩而多变的棋局。博弈游戏就是研究棋手们的“出棋”招数，并对其进行理性化、逻辑化的分析，从而将其系统综合为一门科学。换言之，就是研究个体怎样在各种相互影响的关系中做出最合理的决策，使用最合理的方法。事实上，在古代的游戏中就孕育着博弈论，博弈就像象棋和扑克等游戏一样。

可以说，博弈论是通过“玩游戏”研究人与人之间的策略选择行为，获得人生竞争知识的。博弈论的学者把社会问题和经济问题看成棋局，经常把深刻的道理通过简单的游戏展现出来。

游戏是什么？简单地说，游戏就像是人生的抽象。

比如说，在象棋里的角色有将、相、卒、炮、马之类，这完全就是真实人生和生活的概括和反映。虽然它和人生相比要简略得多，但是能反映一些基本的道理。也正是因为它的简略，那些深藏在复杂生活现象之下的道理才能更清楚地展现。人们往往在纷繁复杂的现实中被细节包围，找不到重点在哪里，以至于陷入只见树木不见森林的困境。但是游戏不一样，它尽量排除一些现实的干扰因素，将其影响变得很小，以此来反映现实，这应该说是做决策的一种很好方法。

比如围棋，中国在4000多年前就开始流行，但是至今大多数人也未能真正地弄懂它，它可能是最简单也是最复杂的游戏，纵19条线横19条线（最初是各17条）组成的网格是一个最简化的棋盘；黑白两种颜色的棋子是最简化的棋子；它使用最简单的规则，一个一点都不懂围棋的人可以在很短的时间内学会，但是它的玄妙却匪夷所思，令人叹为观止。如果你研究一下围棋就能从中领悟到很多道理。在这一点上，游戏有些像我们从小阅读的寓言故事，我们不正是从这些“以小见大”的故事中学会生活的道理吗？

人们从小时候开始就在游戏中学习这个世界的生存规则，怎样生活，怎样处理和他人的关系等，游戏的确是人生的缩影和简化的模型。人们在游戏中确立自己的人格，找到自己的位置。游戏也确实是学习的一种好方法。一位将军曾说过，战场上的成败在学校的操场上就可以显现出来，在平时勤于练习各种技巧和方法，在危难时才不会大乱阵脚。

游戏相对于现实的社会而言，最大的优势是能让你在避免任何经济上的损失的条件下，学到很多东西。比如有一个关于房地产买卖的游戏叫《大富翁》，它可以模拟现实的社会，这样你就可以学会怎样成功地进行房地产买卖，但是在现实中你却不必为此付出任何东西。

想好好地玩游戏需要很多技术和技巧，其中包括一些必要的基本功。例如，踢足球要知道其中的规则以及射门等技巧，下象棋要知道一些招法等。这些技巧可能在生活中并不能立竿见影地派上用场，但是这些游戏里贯穿的博弈论思想和战略则是很有用的，具有普遍的意义，不仅适用于游戏，更适用于工作与生活的很多方面，在很多实践中我们都可以用到。

博弈游戏对你来说可能是一场游戏一场梦，但从梦中醒来的时候，你可能对这个社会有了更深刻地认识。我们的生活，根本就是一个永不停息的博弈决策过程，通过博弈论知识的引导，我们能过上更有品质的生活。

博弈其实很简单

博弈广泛地存在于社会群体之间，群体与个人之间以及个人与个人之间。社会由什么构成？由不同的人，不同的人群构成，而这些人之间，人群之间的关系就构成了博弈。

根据研究博弈论的学者的观点，比较完备的博弈应该包括：第一，博弈的参与者；第二，博弈信息；第三，博弈方可选择的全部行为或策略的集合；第四，博弈的次序；第五，博弈方的收益。顾名思义，博弈的参与者就是博弈过程中独立决策、独立承担后果的个人和组织；博弈信息就是博弈者所掌握的对选择策略有帮助的情报资料；博弈的次序就是博弈参加者做出策略选择的先后；博弈方的收益就是各博弈方做出决策选择后的所得和所失。

下面我们详细来看：

要玩游戏，首先当然得有人玩，所以博弈游戏的第一个要素是局中人。每一个享有决策权力的参与者都被称为局中人，当只有两个人参与的时候被称为“两人博弈”，而两个人以上的称为“多人博弈”。

第二个构成要素是信息。有一个理想状态是完全信息博弈，是指在每个参与者对所有其他参与者（对手）的特征、战略和支付函数都有精确了解的情况下，所进行的博弈。但在现实生活中是不太可能的，我们往往会遭遇信息不对称，博弈双方掌握的信息量并不相同。时间和信息是博弈论中两个至关重要的因素。在博弈过程中，局中人的最优选择和最终的决策取决于传递的信息。自己掌握的信息不如对方多所造成的劣势，几乎是每个人都要面临的困境。谁都不是全知全觉，那怎么办？为了避免困境，我们应该在行动之前，尽可能掌握有关信息，建立信息库，做到认识自己、了解他人。谁都无法预知未来，不知道将要面临的是什么，在不确定的情况下，当然是掌握的信息越多越详尽，越能取得最后的成功。

第三个因素是策略。在博弈中，每个参与者都会根据对方的反应采取相应的对策，但是这个对策不是针对具体哪个阶段，而是整个行动。

第四个构成部分是次序。比如下棋，对弈双方肯定是有先有后，次序很重要，这种行动的次序对最终的结果会施加重要的影响。

最后一个因素是得失收益。任何游戏的结局都有胜有负，每个参与者的成功与失败与他们自身的策略选择密切相关，所以，在一个博弈结束时，参与者的得失是全局所采取的一系列策略的函数，称为支付函数。博弈论按照博弈过程中是否有一个共同的具有约束力的协议可以分为合作博弈和非合作博弈，如果有就是合作博弈，如果没有就是非合作博弈，现代博弈论的研究主要是非合作的博弈。在合作博弈中，注重的是集体的东西，更宏观一点的东西，如团体理性，效率公平公正等，但是在非合作博弈中更加注重的是个人的选择，个人的决策，造成的结果是有时很有效率，有时候没有。

在个体与个体之间的博弈中，应该注意到，我们的朋友、竞争者、妻子和孩子都应被假定为理性的有思想的和关注自身利益的人，是主动的不是被动的。你们之间会有合作也会有竞争，在一定情况下也许追逐的东西不一样，在另一些情况下可能相同，这样就存在着合作的潜在机会。在做出决策时要想到这些方面，并且积极发挥合作和共赢的那一面。

美丽心灵和纳什均衡

1948年数学博士约翰·纳什进入普林斯顿大学，他最为人瞩目的研究成果是1950年的博士论文，作为这篇论文的连锁反应，导致了另外两篇论文的发表，一篇是1950年的《N人博弈中的均衡点》，一篇是1951年的《非合作博弈》。在这些论文中纳什重点阐述了非合作博弈，并且指出了合作博弈和非合作博弈的区别，在对非合作博弈的阐述中包含了一些重要的概念，例如任意人数、局中人和任意偏好等一些重要的通用概念，这些概念奠定了纳什均衡的理论基石。在一种纳什均衡的情况下，所有局中人的预期都得到满足，他们所选择的策略都是最优的。

“假设有n个局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略，从而使自己效用最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种策略组合，这种策略组合由所有参与人的最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。因为均衡打破对自己没有好处，会让自己有更多的损失而不是利益。”以上是纳什均衡的定义，有一个关于“纳什均衡”的最好说明就是“囚徒困境”，后面我们会详细谈到。

在“纳什均衡”里，局中人都确信他可以选择最好的策略来战胜对方的策略，当然是在其他参与人策略决定已经给定的情况下。换言之，就是至少局内人认为他自己的策略是最优的，对自己也最为有利，但是也许事实未必是这样。从纳什均衡理论出发，我们看到，在局中人单独地看来最优的策略也许并不是最有利的，选择在目前看来有好处的策略并不一定对未来和长远有利。

从这里我们得到一个很不愿意看到的悖论：从自利的角度出发，结果不但对自己不利也对别人不利。从这个角度来说，纳什均衡提出的悖论实际上动摇了西方经济学的基石。所以，我们可以得到一个结论，共赢和合作是对双方而言有利的策略，但是必须符合规律：你想让别人怎么对待你，你就怎样对待别人，当然他们也得按这种方式行事才行，也就是中国的古语所说的“己所不欲，勿施于人”。但前提是人所不欲，勿施于我。其次，在现实的世界里，合作要比非合作少，而纳什均衡本身是一种非合作博弈均衡，所以从某种意义上说，纳什均衡是对冯·诺依曼和摩根斯坦的合作博弈理论的重大发展，甚至可以说是一场革命。

现在我们身边经常会遇到很多的价格战，比如家电大战，报业大战等，毋庸置疑的是这种大战的最终受益者是我们消费者，其实各个企业打价格战的结局也是一个纳什均衡，导致的结果是厂家无利可图，都没钱可赚，因为博弈双方的最终平衡点的利润是零。竞争的结果是稳定的，变成了一个纳什均衡，这个结果是企业不愿意看到的。

同质化的成功品牌基本上都有一个强有力的竞争对手，他们之间通过各种战略进行着博弈，在这个竞争的过程中发展自己，从而更好地适应市场的变化，博弈双方通过战略上的选择最终达到一个平衡的状态，在某种程度上他们更是在合作和共赢，而不仅仅是竞争。竞争这个词会让人觉得是你争我夺的残酷局面，比如我们会说可口可乐和百事可乐是竞争者而不是博弈者，因为博弈除了包含竞争之外还存在着一些其他因素，真正的博弈追求的是一种合作，共赢或者说竞争合作并存的结果。单纯地以竞争来阐述博弈是苍白和单薄的，是不全面的。

以麦当劳与肯德基为例，它们在品牌成长中并没有争个你死我活，而是共同把快餐的市场做大，这样它们留给自己的蛋糕自然也就大了，它们共同成长，拉大了和后面跟进者的距离，这对我们很有启示意义。

负和、零和与正和博弈

我们根据博弈论得出的不同结局，将其分为“零和”博弈、“正和”博弈、“负和”博弈。

所谓“零和博弈”就是指博弈最终的效用总和为零，保持在原来的水平，没有增加也没有减少。当我们看见两位老者在下棋，其实就是在进行一场“零和游戏”。因为棋局的大多结果是有一方赢，另一方输，我们假设赢的人得1分，输的人得-1分，那么，当一方赢一方输的时候，两人的得分总和为1+（-1）=0。

股票交易也是一种“零和博弈”，人们投资股市，是渴望在炒买炒卖中赚取差额以获得投资回报。这样，当一个人在股市上赚到钱时，意味着别人因此受了损失，即盈利投资者总的盈利所得与亏损投资者总的损失之和相加为零。

如果我们将“零和博弈”看成一场游戏的话，那么这场“游戏”的基本要求就是：整个游戏必须分出输赢，赢的一方所得等于输的一方所失，游戏总体收益为零。在“零和博弈”中，参与者是自私的，只考虑自身的利益，完全不顾及集体的利益，结果导致集体利益受损，自身利益也不能最大化实现。解决“零和博弈”的方式是必须要在各个参与者之间达成信任，并且对违反约定的人进行惩罚。

以上我们谈到了“零和博弈”，参与者的收益总和等于零。但是在现实的生活中，人们可以通过合作的方式来取得收益，这比参与者单独行动带给参与者的收益更多，合作的总体收益也要大于参与者单独行动的收益总和，起到了1+1>2的效果，我们把这种博弈行为称为“正和博弈”。相反，如果参与人不进行合作，甚至恶意竞争的话，会造成总体资源的浪费，使得总收益小于参与者单独行动的收益总和，带来了1+1<2的结果，这种行为我们称为“负和博弈”。

“零和博弈”之所以被广泛应用，归根结底是其具有很强的社会性，我们在日常的生活中，会发现很多事情都符合“零和博弈”的表现。从社会到个人，从强国到弱国，取得胜利或是拥有财富，往往伴随着失败和财富的损失。无论政治还是经济都是如此，因为世界作为一个大的整体，财富和资源都是有限的，想要获得这些资源或是取得优势地位，就必须伴随着对其他人、其他国家或是地区的侵占，物质上的、精神上的等，这便应验了进化论的道理，弱肉强食，适者生存。

虽然我们强调世界作为一个整体，出现了弱肉强食的“零和博弈”，但现代社会更多地是需要合作，使参与者达到“双赢”的局面。20世纪，人类在两次世界大战以后，经济快速发展、科技不断进步，但伴随发展而来的还有“全球化”、“环境污染”、“能源危机”等现象，这时“零和博弈”逐渐失效，取而代之的是以合作形式实现的“双赢”。人们改变了以往损人利己的观念，通过有效地合作，实现各自的利益。而这种“正和博弈”使得参与者都从中获利，参与者更愿意参与。“正和博弈”使得市场上的资源被充分利用，交易有效地进行。

从“零和”走向“正和”，不是简单的合作，这需要合作双方真诚的态度和彼此互相信任，如果有一方在过程中不讲求诚信，想要侵占别人的财富的话，游戏就不能继续，“正和博弈”的“双赢”局面就无法实现，吃亏的反而是那个违反规则的人。

第2章 走近博弈论，拥有好生活

第2章走近博弈论，拥有好生活