书城管理大数据在中国
4433900000020

第20章 大数据与思维变革(1)

思维数据化--赢在大脑

“怎样才能赢?”这是一个古老的问题,在数千年的文明史中有无数的答案。有人会说:有力量就能赢;也有人说:有财富才能赢。但至少在今天,我的答案是:谁具备了大数据思维,谁就能成为未来最大的赢家。

从目前来看,当大数据时代到来时,任何一家公司的竞争力都可以划分为三种类型。第一种是大数据本身;第二种是与大数据相关的技术;第三种是大数据思维。这三种竞争力当然都是不可替代的,也是缺一不可的,但其中最为关键的,就是把数据与思维结合起来的部分。数据可以被复制,技术也可以被超越,只有思维难以被窃取。拥有领先思维的大数据玩家,最有资格发动一场胜算极大的战争,或者占据最大份额的市场,形成自己坚不可摧的竞争力。

同时我也发现,具备大数据思维优势的公司往往是那些新兴的创业型公司,它们在一个全新的领域内崛起,而且它们的创始人大都具备大数据思维能力和大数据技术,能够及早地发现某特定商业领域中大数据的应用价值,并且做到第一时间把自己的理想付诸实施。在别人进入之前,它们就已完成了垄断。

做企业是这样,生活难道不是这样吗?它对个人也是适用的。你在公司给人打工,怎么让领导发现你的价值?如何让上司觉得你比同事更强?大凡竞争中的赢家,他在今天一定要懂得用数据作为衡量标准,用数据来看待事物。当你拥有这种思维模式时,你会发现这个世界变得完全不一样了,你将比以前更加清醒,也更加理性。

大数据时代的到来,不仅是技术的更新,它同时标志着我们处理信息方式的变化,我们思考问题的模式的升级,我们思维深度的掘进,也是我们智能的进化。随着时间的推移,大数据将会彻底地改变人们思考这个世界的方式。

我们将懂得如何从大量的信息中学习到从较少量的信息中无法获取的东西;

我们将利用越来越多的数据来理解事情和作出决定;我们将发现许多东西是随机的而不是确定的;我们将认识到事物之间相关性与因果性的区别。当然,我们更会强烈地觉察到,今天的世界已经是一个智力博弈的时代,也是属于思维为王的新世纪。随着大数据处理能力的提高,大数据产业对于工作和生活各个层面的渗透,人类的观察力、记忆力、想象力、分析判断能力、思维能力、应变能力也将会得到质的提升。

你会逐渐而且惊奇地发现,不但自己更加理性,城市也在变得智能化。

未来的世界将彻底变成一个大脑为王的竞技场,金钱和权力都将成为大脑的奴仆。人类的大脑创造数据,也将支配数据。

其实早在五六年前,行业领先者们就已预言:大数据的到来将引发一场新的“智慧革命”。我们可以从海量、复杂、实时的大数据中发现知识,提升智能,为社会创造更大的价值。所以,尽管存在这样或那样的不足,但大数据时代一定是美好的时代,因为数据化正在可控的范围内让我们的生活更美好,让我们的工作更方便,让我们的未来更清晰,也让人类看到了改变世界整体结构的希望,让它逐步具备“智慧”特征,从而通过数据这个工具,实现人与自然的沟通,互相之间进行智慧与理性的交流。

那么,到这时候,我们的学习、工作、生活、娱乐以及交通、医疗、能源利用方式等等都将随之改变。我们可以改变自己的头脑,从海量数据中获取所必需的工具和技能;可以提升自己的智慧,以大数据的思维重塑自己的人生战略,增强竞争力。

中国的大数据逻辑:因果关系﹥相关关系

在今天的时代,我们需要更换思维,以全新的头脑和运算逻辑来看待每一件事物,才能从中发现新的东西,释放更多的生产力。大数据就为我们提供了一种可以全视角观察世界的新方式。

☆重要区别--从因果性的分析到相关性的分析

国外的大数据思维认为--如同欧美的大数据专家们在采访中所讲的,一项重要的思维转换就是从传统的因果性分析向相关性分析转换,只有以相关性为主,才能真正体现大数据的思维特点。他们认为,大数据的出现有一点是常被人忽视的,那就是悄悄地改变了人们过往普遍追求的因果性的思维逻辑。

美国大数据专家罗伯特说:“大数据主要从相关性着手,而不是因果关系,这从本质上改变了传统数据的开采模式。”

比如,他举例说,谷歌的研究人员在2009年发表了一篇论文,成功地预测到了季节性流感的爆发,引起了医学界的轰动。研究人员对2003年到2008年之间的最频繁搜索词条(多达5000万)进行了非常全面的分析,希望能够发现某些搜索词条的地理位置的特征--是否和美国流感疾病预防和控制中心发布的数据相关。

罗伯特说:“疾病预防控制中心会定期跟踪全美各地的医院以及私人诊所的病患,然后汇总和发布相关的信息,但往往会滞后一两个礼拜,这是必然的,这些信息的人工整理需要一定的时间,但谷歌的大数据能发现实时的趋势,这些词条都是实时的,有对应的时间和地点的记录。”

最后,谷歌公司将得出的预测与疾病预防控制中心记录的最近两年内的实际流感病例进行对比后发现,大数据处理结果找到了45条检索词条的组合,通过合适的数据模型计算后,通过相关性的预测得出的结论,与官方数据的重叠性高达97%,这表明通过相关性分析是可以解决此类预测问题的。

欧洲有一家航空公司,它的会员不下数百万。会员的一个重要信息就是邮箱的地址。另外,推特的账号申请也需要一个邮箱地址。通常来说,同一个邮箱地址就意味着航空公司里的会员和推特的会员应该是同一个人。

于是,这家航空公司就做了一个筛选,从中归并出了十万个用户。接下来做什么呢?航空公司请了一家第三方公司的数据部门过来,任务就是看一看这十万名用户会在社交平台上干些什么,比如他们说些什么,关注些什么,以及喜欢介入什么样的话题去转发评论,或者喜欢关注一些什么样的商业媒体。

这家航空公司的目的在于,研究一下自己需要在社交平台上发起什么样的活动,以及给予什么样的礼品或折扣,才能吸引这十万名会员前来参加,成为公司的贵宾用户,给公司提供利润的增长点。

在这个故事中所涉及的数据虽然足足与十万个人有关,但还算不上海量数据。但它的本质其实就是体现了相关性的价值。航空公司寻求相关性,从而判断自己新的利润增长点在哪里,以及发现潜在的贵宾用户有哪些,然后据此做出高效的决策或采取针对性的营销活动。

☆中国的大数据哲学--因果关系优先

相关性当然十分重要,通过上面的例子我们也已经体会到了它的魔力。通过相关性,我们发现了它对于预测的巨大价值,而其背后则是思维与分析方式的更新。相关性帮助我们从对过去的理解变更为对未来的预测。

但是,因果关系仍然是相关性的逻辑基础。因为数据并不仅是冷冰冰的符号,数据只是事物之间发生联系的代表,而我们每个人都可以将自己作为一个普通个体的因素包容到这个分析体系中,个人的主观的东西会极大地影响体系的方向与决策,这种影响甚至是决定性的。比如人的本身存在的各种因素:风险、意外、热爱、冷酷,甚至是某些错误,都可以在大数据的变化中体现出来,这是相关性无法体现的,必须由因果性加以定义。

“那么,重要的问题来了,因果关系跟相关关系的关系是什么?”因果关系代表主观性,是人的因素;相关关系代表客观性,是信息的因素。人与信息是结合的,不可分割,也就意味着因果关系与相关关系不可分离。尤其对于中国人来说,我们看到了一个相关性,就会想了解为什么,探究其背后的原因,而不只是商业或市场机会,也不仅仅代表某种现象。

当你开始给出一个假设,建立一个模型,然后去验证这个模型时,这里面就会立刻带入你自己的主观因素,也就是原因。原因即因果性,它决定我们的方向。

这种全新的思维方式和先后顺序是非常重要的。如果你只重相关性,就会因为缺乏因果关系的支撑而背离分析的初衷;如果只重因果性,则会由于忽视了相关关系,而在数据收集时丧失对海量数据和关键信息的把握。

简单优于复杂