第16章重复博弈：骗子不是道德问题

书签收藏评论目录封面

在对住宅小区内的超市和火车站点的超市的质量和服务的比较中，我们就可以看到重复博弈的影子。重复博弈说明，对未来的预期是影响我们行为的重要因素。一种是预期收益：我这样做，将来有什么好处；一种是预期风险：我这样做可能将来面临问题。这都将影响到个人的策略。

从“一锤子买卖”和“59岁现象”看重复博弈

下班回家的路上，你像往常一样去菜场买菜，当你对某种菜的质量有疑虑时，卖菜的阿姨常会讲：“你放心，我一直在这儿卖呢！”这句朴实的话中其实包含了深刻的博弈论思想：我卖与你买是一个次数无限的重复博弈，我今天骗了你，你今后就不会再来我这儿买了，所以我不会骗你的，菜的质量肯定没问题。而你在听了阿姨的上述一句话后，常常也会打消疑虑，买菜回家。

相反，你在出差或在旅行时常会在车站或景点购物时发现，这些人群流动性大的地方，不但商品和服务质量差，而且假货横行。这是因为此时在商家和顾客之间不是“重复博弈”。一个旅客不大可能因为你的饭菜可口而再次光临，这种一次性博弈，是“一锤子买卖”，不赚白不赚。对方卖了假货给你，你也只好自认倒霉，多半不至于搭车赶回来和人较真。一些人在快调离原单位或快退休时的拙劣表现也是也是如此，后者常被称为“59岁现象”。

由此看来，所谓重复博弈，是指同样结构的博弈重复多次，其中的每次博弈成为“阶段博弈”。重复博弈是动态博弈中的重要内容，它可以是完全信息的重复博弈，也可以是不完全信息的重复博弈。

重复博弈说明，对未来的预期是影响我们行为的重要因素。一种是预期收益：我这样做，将来有什么好处；一种是预期风险：我这样做可能将来面临问题。这都将影响个人的策略。

譬如，你在社区开了一家便利店，此时你就要考虑预期的收益和风险。因为你的赢利靠的是那些“回头客”——周围的居民，他们是你的衣食父母。如果你的便利店欺骗顾客，那么你就会面临失去长期的赢利机会的风险。所以此时你会选择诚实对待顾客。

其实，在任何博弈中，表现最好的策略直接取决于对方采用的策略，特别是取决于这个策略为双方合作留出多大的余地。这个策略的基础是下一步对于当前一步的影响足够大，即未来是重要的。总的来说，如果你认为今后将难以与对方相遇，或者你不太关心自己未来的利益，那么，你现在可以选择适度地背叛，而不用担心未来的后果；反之，如果你们今后见面的机会很大，那么你最好还是选择与对方合作。

诚信只不过是重复博弈下的博弈手段

从上面的分析中我们看出，当人们之间进行的是一场没有明天的一次性博弈时，大家都倾向于选择欺骗、背叛。而只有当人们之间进行的是一种重复博弈时，大家才会恪守诚信。所以说，平时我们讲信用而不骗人，不过是重复博弈里的一种手段罢了。

博弈是双方“斗智斗勇”的过程，在一种较为完善的经济制度下，若博弈会重复发生，则人们会更倾向于相互信任。这可以用一个简单的博弈模型来解释。假设有甲、乙两人，甲出售产品，乙付货款（商业信用问题），或甲借钱给乙，乙是否还钱（银行信用问题）。开始时，甲有两种选择：信任乙或不信任乙；乙也有两种选择：守信或不守信。如果博弈只进行一次，对乙来说，一旦借到钱最佳选择是不还。甲当然知道乙会这样做，甲的最佳选择是不信任。结果是，甲不信任乙，乙不守信，这样的结果是最糟糕的，双方想达成有效交易是非常难的。

那么怎样才能让双方的利益得到一个均衡呢？假定博弈可以进行多次，甲采取一种这样的策略：我先信任你，如果你没有欺骗我，我将一直信赖你；而一旦你欺骗了我，我再也不会相信你。这样乙有相应的两种选择，如果守信，得到的利益是长远的；如果不守信，得到的利益是一次性的。因此，守信是乙的利益所在。这样双方都会处于一种均衡状态，这种均衡的出现是因为乙谋求长远利益而牺牲眼前利益（当然是不当得利）。所以说当一个人考虑重复博弈下的长远利益时，自然就会采取守信策略。

所以说，诚信只是为让自己在以后的重复博弈中继续获得利益，这是一种长远的打算。诚信的人一般都是聪明人，他们懂得细水长流的道理，对于“善有善报”这样的言语充满敬畏。

如果有一个人总是出卖朋友，那么他可能从第一次、第二次、第三次出卖中获得利益，但是长此以往，人们就会认清他的真面目，并传播他的劣迹。这样，到了最后，他就会变得没有朋友可以出卖，因为他一直靠出卖朋友生存，当他没有朋友的时候，就是他穷途末路的时候，最终他只能得到众叛亲离的下场。

现在，我们明白了，诚信是在重复博弈中实现利益最大化的一种手段，如果剥离了重复博弈这一前提，或者在重复博弈中最终无利可图，人们便不会有诚信之举。

也许你会举出英雄人物的例子来反驳，但是英雄人物最终得到了人们的敬仰和爱戴，他们流芳百世、永垂不朽，如果他们舍己为人的结果是被人指责、唾骂，遗臭万年，他们绝不会选择当英雄。

努力构建“熟人社会”

我们经常会在电视剧中看到这样的场景：一对素昧平生的男女，偶尔在酒吧相遇，借着酒精的迷醉，有意或无意藏起自己的理性，在宾馆里春梦一场，然后等天一亮就各自扬长而去，谁也不会忠于谁，彼此也不会为对方今后的不忠而产生任何不快。

对于上述的问题，现代博弈论提供了很深刻的解释：每一次人际交往其实都可以简化为两种基本选择：合作还是背叛。在人际交往中普遍存在囚徒困境：双方明知合作带来双赢，但理性的自私和信任的缺乏导致合作难以产生。

在这样的博弈中，背叛是个人的理性选择，但却直接导致集体的非理性。难道真的没有办法让人类走上集体合作的双赢之路吗？

资深博弈论专家罗伯特·奥曼在1995年指出，人与人的长期交往是避免短期冲突、走向协作的重要机制。罗伯特·奥曼在此所指的长期交往即构建一个“熟人社会”，通过人与人之间的重复博弈来协调人们利益冲突，增进社会福利。

譬如，在公共汽车上，两个陌生人会为一个座位争吵，可如果他们认识，就会相互谦让。在社会联系紧密的人际关系中，人们普遍比较注意礼节、道德，因为大家都需要这个环境。

在古朴乡村，犯罪率一般会很低，这是因为大家在一个村子里，世代生活在一起，整日“低头不见抬头见”，若做损人利己之事，必招致对方的记恨以及村民的道德谴责。而在繁华的都市，人们相对陌生，同楼居民“电视之声相闻，老死不相往来”者甚多，如果法制不健全，犯罪率就有可能提高。

从以上的比较中，我们可以明显看出，在人群之间构建一个“熟人社会”，可以让我们走上真正的和谐之路。“熟人社会”这一概念，是费孝通先生提出的。费先生认为，中国传统社会是一个“熟人社会”，其特点是人与人之间有着一种私人关系，人与人通过这种关系联系起来，构成一张张关系网。背景和关系是“熟人社会”的典型话语。民间“熟人好办事”的说法，正是对“熟人社会”的一种朴素表达。

费孝通先生认为，在现代社会中，由于社会变迁、人口流动，在越来越大的社会空间里，人们成为陌生人，由此法律才有产生的必要。因为当一个社会成为一个“陌生人社会”的时候，社会的发展就会依赖于契约和制度，人与人之间的交往就必须通过制度和规则，建立起彼此的关系与信任。随着契约、制度和规则的逐步发育，法律就自然地成长起来。

但如果我们处于一个熟人社会中，情况就会有很大不同。此时，道德、法律、权力利益的划分，都与“还要见面”有关。从消极的层面看，我们互不侵犯，是为了避免没完没了、两败俱伤的循环报应。例如，两个原始人见面，一个拿着兽皮，一个拿着野果，他们都想把对方的东西据为己有。如果他们的见面是偶然的，可能相互抢劫。可是如果他们都生活在附近，考虑到对方家族的报复，抢劫的风险就大了，所以他们不去打对方的主意——所有权就这样产生了。如果确实想得到对方的东西，他们可以选择合作——以物易物，交易就这样产生了。

所以，构建一个熟人社会是我们走向共赢的最好策略。值得庆幸的是，随着网络的发展，地球正在浓缩成一个村落，新熟人社会的构建指日可待。

一报还一报带来合作

重复博弈研究的是人与人之间的合作关系。对于整个人类社会而言，构建一个“熟人社会”，是促进人与人之间合作的一种有效策略，但这并不意味着只需构建一个“熟人社会”便万事皆休，人与人之间便并不会有背叛发生。人性的复杂决定了我们在重复博弈的情况下还需采取其他的策略来保证合作，一报还一报策略就是其中一种。为了理解该策略，我们可以先看一个小故事。

某天深夜，一教授正在熟睡之际，电话铃突然响了起来。他睡眼惺忪拿起电话，听筒里传来女邻居怒气冲冲的声音：“麻烦你管一下你的狗，不要再让它叫了。”说完，电话就挂了。这位教授十分生气。第二天他定好闹钟，半夜两点钟准时起床，拿起电话拨通了这位女邻居家。过了半天，对方才拿起听筒，带着睡意恼怒地问：“哪一位？”这位教授彬彬有礼地告诉她：“夫人，昨天我忘记告诉你了，我们家没有养狗。”

从上面这个小笑话当中，我们可以发现在没有法规和道德的约束，也没有其他力量从外部对双方进行强制时，对自己最有利的一种策略——一报还一报。

一报还一报策略是美国密西西根大学的学者罗伯特·爱克斯罗德首先提出的。他通过研究发现，在与他人发生的重复博弈中要想他人与自己合作，必须做到以下几个方面：

第一，善良，是指在与他人第一次接触时总是向对方表达善意。要坚持永远不首先背叛对方，开始总是选择合作，而不是一开始就选择背叛或主动作弊。

第二，可激怒，是指对方出现背叛行动时，要能够及时识别并一定要采取背叛的行动来报复，不让背叛者逍遥法外。

第三，宽容，是指不要因为别人一次背叛，长时间怀恨在心或者没完没了地报复，而是在对方改过自新、重新回到合作轨道时，能既往不咎，恢复合作。

第四，简单，是指做事风格要简单，易于识别，能让对方在较短时间内辨识其策略所在。

第五，不妒忌，是指不耍小聪明，不占对方便宜，不在任何双边关系中争强好胜。

这五个方面结合起来，就是“一报还一报”策略，其实，友善、有原则、宽容、简单、不妒忌朋友的成功，这些信条本来就是我们生活中应有的为人处世之道。只是很少人会用博弈论模型的科学结论作指导，将这些信条连接起来作为一种策略组合行事。

这一策略可以用来指导我们在重复博弈中作出最佳选择，比如怎样在与恋人的重复博弈中获得幸福爱情。

世界上的每对恋人都要承受未来不确定性的折磨：如果双方都不变心，那是最好的结局，在天成为比翼鸟，在地成为连理枝；如果都变了心，效果也不坏，你走你的阳关道，我过我的独木桥。如果一方变了心，另外找到了更好的情侣，另一方却还傻乎乎地忠贞不贰，那么，另觅新欢的一方是最幸福的，比两人都不变心的结果还幸福，因为他找见了更好的情人；而被抛弃的一方是最不幸的，比两人都变心的结果更为不幸，因为他承担的压力既来自于自己的不幸福，也来自于对方的太幸福。那么有没有一种方法能够消除这种不确定性的折磨，让两人都对彼此忠贞不贰从而换来一个好的结果呢？

人在恋爱的时候都爱发誓，他们希望通过“非你不嫁非你不娶”之类的誓言让对方相信自己此情不渝，但事实上，一对恋人相互间的忠诚，靠的不是这种情深爱笃的誓言，而是需要一定的博弈策略。在恋爱这场不太好玩的“游戏”中，谁能熟练地驾驭博弈规则，谁就是爱情的赢家。

很明显，胜利总是属于那些采取善意、强硬、宽容和简单明了的一报还一报策略的恋人们。反之，恶意的、软弱的、尖刻的、复杂的恋人们往往会两败俱伤。所以，对于正在恋爱中的人们来说，获得幸福爱情的博弈原则应该是：

第一，善意而不是恶意地对待恋人。

第二，强硬有原则而不是软弱无原则地对待恋人。要在“我永远爱你”的前提下，做到有爱必报，有恨也必报，以眼还眼，以牙还牙，以其人之道，还治其人之身。比如对恋人与其他异性的亲热行为，要有极其强烈的敏感与斩钉截铁的回报。当然，每次发脾气都是有限度的，而且还要在对方知错的情况下宽容对方。

第三，宽容而不是尖刻地对待恋人。幸福的恋人可能并不是忠贞不贰的，当然也不是见异思迁的，他们能够生活得愉快，关键是能够彼此宽容，既宽容对方的缺点，甚至也宽容对方偶尔的不忠贞。

第四，简单明了而不是山环水绕地对待恋人。爱克斯罗德的实验证明，在博弈过程中，过分复杂的策略使得对手难以理解，无所适从，因而难以建立稳定的合作关系。

事实上，在一个重复博弈的环境里，“城府深沉”、“兵不厌诈”、“揣着明白装糊涂”，往往并非上策。相反，明晰的个性、简练的作风和坦诚的态度倒是制胜的要诀。要让恋人明白你说的是什么，切忌让对方猜来猜去的，造成误会。

提防恋人背叛未必能在恋爱中获胜，相反对善意的、宽容的、强硬的、简单明了的一报还一报策略的把握和利用，才有可能获得地老天荒的爱情和白首偕老的婚姻。

可以看出，一报还一报策略可以促进人与人之间的合作，从而形成基于个体理性（利己动机）的集体理性结局（正的外部性或者利他行为），形成社会的道德共识。简单说就是：你对我好，我就对你好；你对我不好，我也对你不好。我对你好，是为了你能继续对我好。我对你不好，不是睚眦必报的互相损害，而是要将对方重新拉回合作的轨道。所以，一报还一报策略最终能够带来双方的合作。

背离重复博弈的诚信是不可取的

前面我们一直探讨的是如何利用重复博弈来减少人与人之间的欺骗，促进合作。但是，人们信守诺言无非是为了减少交易成本或下次打交道能获得更大的预期收益。如果背离了重复博弈的这个因素，盲目讲究诚信是不可取的。

北宋年间，朝廷派遣能征善战的将军狄青领兵南征。当时朝廷中主和、妥协派势力颇强，狄青所部亦有些将领怯战，有的甚至散播谣言，说什么“梦见神人指示，宋兵南征必败”。军中不少有迷信思想的官兵尽皆惶然，笃信此次南征“凶多吉少，难操胜券”，一时军心涣散。狄青一再训说：“我军乃正义之师，战必胜，攻必克。”无奈官兵迷信思想极重，收效甚微。

对此，狄青和几员心腹大将苦无良策。大军途经桂林，恰逢大雨滂沱，一连数天，乌云蔽日，无法行军。此时军中谣言更甚，都说出师不利，天降凶雨，旨在回师。

这天黄昏，狄青带领几员偏将冒雨巡视，路经一座古庙，见冒雨进香占卜者不少，便进庙询问。庙中和尚说，都说该庙神佛灵验，有求必应，所以终年拜佛占卜者络绎不绝。

狄青听罢，心中顿生妙计。次日清晨，他全身披挂，领将士入庙拜佛，虔诚地供香跪拜后，便对将士们说：“本帅当众占卜一卦，欲知南征凶吉。”说毕，他请庙祝捧出百枚铜钱，说明一面涂红，一面涂黑，然后当众合掌祈祷：“狄青此次出兵南征，如能大获全胜，百枚铜钱当红面向上！”只见他将铜钱一掷，落地有声，果然全都是红色。将士们惊异万分，兴高采烈，奔走相告，一时士气大振。

狄青当即下令不准再动铜钱，以免冒犯神灵，同时令心腹将士取来百枚长钉，把铜钱牢钉在地，然后对全军说道：“此战必胜，这是上天助我！等到班师之日，再来感谢神灵取钱！”第二天雨过天晴，宋军士气高昂，直压边境。两军对阵，宋军将士无不奋勇当先，所向披靡，直把安南入侵者杀得丢盔弃甲，溃不成军，乖乖地立下降书，自称永不敢再犯大宋边境。

宋军班师回朝，狄青高兴地带领一班将校到古庙谢神还愿，拔钉取钱时，一位偏将忽然惊呼：“奇怪，奇怪！这百枚铜钱怎么两面都是红色？！”

狄青哈哈大笑道：“此举绝非神灵，其实是本将军借神佛之灵，鼓舞士气罢了！”此时大家才恍然大悟，原来狄将军私下和几位心腹将士暗将铜钱两面都涂成红色，故弄玄虚，利用将士们的迷信心理，化厌战情绪为勇战情绪，一鼓作气战胜侵略军。

欺骗，连3岁小孩子都知道这是一个坏习惯，可是，在背离重复博弈的减少交易成本、获得更大的预期收益的因素的情况下，盲目恪守诚信反而会吃大亏，因此，在背离重复博弈的情况下，我们应当放弃对“绝对诚实”的固执，用适当地“欺骗”去获取成功。故事中狄青能带领部将战胜敌军，靠的就是适当欺骗策略。

也许会有人说，欺骗是一种不道德的行为，只有诚实的人才是道德的，事实果真如此吗？关于道德与欺骗的辩证关系，古希腊大哲学家苏格拉底曾有过精彩的论述。

一天，苏格拉底像往常一样，赤脚敞衫，来到市场上。突然，他一把拉住一个过路人问道：“我有一个问题不明白，向您请教。人人都说做一个有道德的人，但究竟什么是道德？”

“忠诚老实，不欺骗人，这就是公认的道德。”那人回答道。

苏格拉底问：“您说道德是不能欺骗人的，但在和敌人交战的时候，我军将士千方百计地去欺骗敌人，这能说不道德吗？”

那人答：“欺骗敌人是符合道德的，但欺骗自己人就不道德了。”

苏格拉底问：“那如果和敌人作战时，我军被包围了，处境险恶。为了鼓舞士气，将领欺骗士兵说：‘我们的援军就要到了，大家奋力突围。’结果成功了。这种欺骗能说不道德吗？”

那人答：“那是出于无奈，我们在日常生活中就不能这样。”

苏格拉底又问：“我们常常会遇到这样的问题，儿子生病了，又不肯吃药，父亲骗儿子说：‘这不是药，是一种十分好吃的东西。难道这也是不道德吗？’”

那人只好承认：“这种善意的欺骗行为是道德的。”

苏格拉底于是问：“不骗人是道德的，骗人也可以是道德的，也就是说，道德不能用骗不骗人来说明。究竟用什么来说明呢？你告诉我吧。”

那人只好说：“不知道道德就不能做到道德，知道了道德就是道德。”

苏格拉底高兴地说：“您真是一位伟大的哲学家，您告诉了我道德就是关于道德的知识，使我明白了一个长期以来的困惑问题，我衷心地谢谢您。”

这里我们也明白了另外一个道理：欺骗作为一种策略，本来就与道德无关。

当然，我们这里所说的欺骗是以背离重复博弈为原则的，如果没有背离重复博弈，我们还是应该讲究诚信，以求减少交易成本和获取更大的预期收益。

第16章 重复博弈：骗子不是道德问题

第16章重复博弈：骗子不是道德问题