还有其他几种预测模型也采用相似的方法,把美国总统大选这类复杂的问题用“两个变量”的方程式解决(奇怪的是,这些模型中所用的两个变量五花八门)。实际上,在这些预测模型中,有些模型的跟踪记录远不及希布斯的预测模型准确。2000年,其中一个预测模型预计戈尔会以19个点取胜,甚至还预测小布什只有十万分之一的概率获胜。
这样的预测模型在1988年美国总统大选之后开始盛行,因为在这次竞选中此类模型的基本变量一直偏向老布什一方——经济运行良好,老布什代表的共和党有一位颇受民众欢迎的前任总统里根——但直到本次大选后期,民意调查都是偏向迈克尔·杜卡基斯一方的。最终,老布什轻松获胜。
然而,尽管这类预测模型越来越多,但它们的跟踪记录却很差。1992年以后的5次美国总统大选中,这个“基于基本变量”的典型预测模型——它忽略了民意调查,声称在没有相关信息的情况下仍可辨清选民的动向——结果漏掉了几位主要候选人之间高达7%的点数差距。而采用狐狸式方法的预测模式,把经济数据、民调数据以及其他类型的信息结合在一起,得出了更为可靠的预测结果。
定性信息与定量信息同等重要
虽然这些“魔法子弹”式(结果发生逆转)的预测模式依据的是定量信息,比如已公布的经济统计数据,但还是失败了。实际上,本书所引用的那些最差劲的预测案例有些就是定量分析的案例。比如,那些评级机构就是运用不同模型对不同类型的抵押贷款的违约率进行预测,它们得到的都是精确到具体数据的估值。然而这些模型却漏洞百出,因为它们依据的是一种利己假设——不同抵押贷款之间的违约风险互不相干——这一假设在房地产市场和信用泡沫中完全行不通。当然,我自己在作预测时也非常喜欢运用定量的方法。刺猬型专家会接收各种类型的信息,并借助这些信息强化他们的偏见,而狐狸型专家则会对不同类型的信息进行总体权衡,将定性分析和定量分析结合起来,所以能经常做出正确的预测。
说到预测成功率,没有几个政治分析家能比得过“库克政治报道”这样一个紧密团结的团队。来自路易斯安那州的查理·库克长了一张友善的圆脸,他在1984年组建了这个团队,当时在贝尔特威以外的地方几乎没有人听说过他们。但是,政治狂热者多年来一直十分信任库克团队的预测,而且这个团队也几乎没让他们失望过。
库克和他的团队有一项特殊使命:对全美各级选举的结果进行预测,特别是对美国国会的选举结果进行预测。这就意味着,每隔一年,他们就要对外发布对美国众议院全部435场竞选结果的预测,还要发布对美国参议院大约35场竞选结果的预测报告。
预测美国参议院选举或是州长竞选的结果相对简单。因为选民一般对这些候选人都非常熟悉,这些最为重要的竞选活动往往会引起广泛关注,还会有声誉良好的公司定期进行民意调查。在这种情况下,想要像我在538网站中那样改进收集民调结果的方法并非易事。
而美国众议院选举就完全是另外一番景象了。候选人通常身份比较低微,其中包括那些想在美国政坛一展身手的市议会议员或小企业家,而且在选举前,这些候选人一般不为选民所熟知。同时,美国国会选区几乎遍布全国各个角落,全美国人都被调动起来了。如果有人能够提供众议院选区的民调结果,这个结果必定是最起伏不定的,当然通常情况下几乎没有人能提供。
但这并不意味着像库克这样的分析家就无从知晓信息了,事实上,他们得到的信息量很大:除了民调结果,他们还知道某个选区的人口数据,也了解该选区此前几次选举的投票情况。他们还掌握了美国党派的总体发展趋势的数据,比如现任总统的支持率。此外,他们甚至能得到必须上报美国联邦选举委员会的筹款数据。
除了上述信息,其他类型的信息更偏向于定性信息,但同样很重要。比如,这位候选人是一个出色的公共演说家吗?她所在选区的政纲基调是什么?她的竞选口号是什么?政治活动其实就是一个小公司,她能管理好自己的职员吗?
当然,如果你是一个不仔细权衡定性信息的刺猬型专家,那么所有的信息就只会给你带来麻烦。库克的团队在预测方面很有经验,准确度也很高。
库克团队把竞选划分为从“共和党必胜派”到“民主党必胜派”7个等级。1998~2010年间,库克团队成功预测共和党候选人获胜的次数为1 205次(共1 207次竞选),达到了99%以上的成功率,同样的,他们成功预测民主党候选人取胜的次数为1 226次(共1 229次竞选)。
库克提到的那些“民主党必胜派”获胜的选区几乎每年都是民主党获胜,“共和党必胜派”获胜的选区每年则都是共和党获选,这些预测都不难作。但是,在需要高技术水平的竞选预测中,库克团队同样表现不俗。比如,在被他们列为“倾向于”共和党候选人的那些选举中,共和党实际获胜的概率高达95%;在被列为“倾向于”民主党候选人的选举中,民主党获胜的概率高达92%。此外,即使库克团队并不赞同民调那样的定量指标,但他们在相关预测中仍然拥有良好的跟踪记录。
2010年9月,大概是2010年11月选举活动开始前5周的光景,我在华盛顿拜访了库克团队,整个下午,我都和戴维·瓦瑟曼在一起,他的年龄约为30岁,一头卷发,负责管理众议院的预测事务。
库克团队最具特色之处就体现在他们与候选人的面谈环节。美国总统大选期间,位于水门综合大厦5楼的库克工作室入口处总是人头攒动,候选人时不时地过来聊上个把小时,谈论的话题无外乎是筹款和战略会议。我拜访瓦瑟曼那天,他安排了3场面谈。他让我和一个叫丹·卡潘克的共和党候选人一起与他见面。卡潘克想要击败威斯康星州第三国会选区的现任民主党议员罗恩·坎德,这个选区包含这个州西南部的几个小社区。库克团队已经将这次竞选认定为“民主党可能获胜”,也就是说卡潘克获胜的概率很低,但是他们当时正在考虑将这一选区改为形势更有利的“民主党必胜”区。
做农场补给生意的州参议员卡潘克举止粗暴,像个高中体育老师。他还有一口浓重的威斯康星州口音,当他谈到自己拥有一支名为“拉克洛斯罗格”(La Crosse Loggers)的小型联盟棒球队时,我都不确定他说的是“logger”(伐木工),还是“lager”(一种淡啤酒的牌子),哪个词听上去都像是这个来自威斯康星州的俱乐部的别名。不过,他朴素的话语使人可以多少忽略其举止的粗暴,所以在通常民主党占优势的选区,他也始终能在州议会中任参议员。
然而,瓦瑟曼在面谈时运用了一些扑克牌游戏的规则。他一脸严肃且不失职业风范,但他会巧妙地给候选人施压,以找到更多信息。
他对我说:“我的基本技巧是,在面谈开始时让候选人谈谈自己的情况,从而营造一种舒适友好的气氛。然后,我试着提一些尖锐的问题,比如,说说你在哪些问题上与你所属党派的领导人意见不同。这么做的目的并不是让他们提供解决办法,只是想要了解他们的作风和处事方法。”
与卡潘克的面谈就是按照这一模式进行的。瓦瑟曼对选区的政治、地理状况无所不知,这使他看起来很像一个当地人,卡潘克也乐于谈论有关他所在选区的复杂情况,例如他在拉克洛斯需要获得多少票数才能弥补他在奥克莱尔丢掉的选票。他啰啰唆唆地说了几个问题,主要内容是他用说客们游说得来的捐款为俱乐部买了一个全新的棒球场。
这都是一些小事,远不及卡潘克因为婚外情和偷税漏税被起诉来得重要。这两件事足以劝阻瓦瑟曼不要改变评价。事实上,尽管那年11月共和党在中西部相似选区的大部分竞选中都取得了胜利,但卡潘克本人还是以9 500张选票的差距落选了。
事实上,这种情况很常见。面谈之后,瓦瑟曼通常会保持(与面谈前)同样的评价。尽管他努力地从候选人那里收集新信息,可还是不能推翻他之前对竞选结果的看法。
瓦瑟曼的方法之所以奏效,是因为他能在不受对面这位候选人影响的情况下,对信息做出评价。能力不足的分析师不是表现得像是被迷惑、被欺骗、被耍弄,就是在竞选活动中迷失自我。或者,他们只顾着对自己与候选人谈话时所使用的技巧感到沾沾自喜,却忽略了其他所有与竞选相关的信息。
而瓦瑟曼会考虑更大的政治背景中的每一件事。极其优秀的民主党候选人,即使面谈时表现超级棒,可能也没有机会在共和党通常获胜的选区取胜。
那为什么还要费时费力地与候选人进行面谈呢?这主要是因为瓦瑟曼在寻找危险信号,就像那次与民主党议员艾瑞克·马萨(在传出性丑闻之后突然从国会辞职)面谈一样。心理学家保罗·米尔将这些情况称为“断腿”情况,即如果一件事情太过招人耳目,那么不对它进行解释说明就是不明智的。
这种现象,每年瓦瑟曼都会遇到几例,这使得他能够正确预测更多的竞选。他能够从面谈中得到足量但不过量的信息。信息是定性的还是定量的,这并不重要,重要的是你怎样使用这些信息。
做出客观的预测并非易事
在本书中,我使用“客观”和“主观”这两个词时,都非常谨慎。“客观”有时被认为是“定量”的同义词,其实不然。它的实际意义是超越我们的个人喜好和偏见,去寻找问题的真相。
在这个世界上,纯粹的客观性是求之而不得的。进行预测时,我们可以选择很多不同的方法。有些方法可能单纯依赖定量因素,比如民意调查,但是瓦瑟曼的方法也将定性因素考虑在内。然而,所有这些决定和假设都要由预测人做出。人为的判断终究会存在潜在的偏见。只有认识到假设对预测的影响,并从自身找问题,才能做到更加客观。在政治预测上,我们穿梭于意识取向和行为倾向之间,在嘈杂的数据中理顺客观事实,这是相当困难的。
所以,你需要从电视评论员身上学习一些不同的习惯,学会怎样表达预测中的不确定性,并使其量化。随着事实和环境的改变,你的预测也要跟着更新,你要试着发现,从不同视角看世界也会得到智慧。只有这样,评估各式各样信息的能力才会越来越强,而不至于滥用这些信息。
简而言之,你需要学习狐狸型专家的思维方式。狐狸型专家认识到了人类在预测世界进程时所作判断的局限性。认识到这些局限,才能做出更准确的预测。