书城管理大数据在中国
4433900000023

第23章 大数据与生活变革(2)

我们每个人都是大数据世界里的一个小分母,同时,我们也都是有权享有个性化服务的VIP。

据汤兴说,绿镜的下一步将会进入新闻和体育节目领域。新的版本可以让用户自己设定看节目的时间,比如早上起床刷牙舒展身体的时候想要来一次10分钟的要闻浏览,那么用户就可以选10分钟的选项,在这10分钟里可以看到最精彩的新闻。如果你是一个足球爱好者,一定会喜欢这个版本,因为一场90分钟的球赛,真正最精彩的往往就10分钟,大多球迷只想看进球。

其实,对于爱奇艺来说,绿镜还可以衍生出另一个产品--更精准的收视数据,很多制片人对此求之不得。

比如,在北京的郊区有一个影棚,制片人王凡做了一档叫作《大王小王》的情感访谈节目,研究上一期节目的收视率则是他必须要做的功课,王凡的数据就来自第三方机构。

问题是,长久以来的统计方式都无法让业内满意,其衡量收视率的数据准确度并不高。

传统的收视率调查采用抽样调查方式:在一个城市里,根据当地居民的性别比例、年龄分布以及职业和收入情况等,选取一定数量的样本户,通过对样本户收看内容的监测,来推算整个地区的收视情况。

其实样本户的数量非常有限,比如一个城市有上千万的人口,但样本户的数量通常不会超过500户。而如果有样本户受到贿赂,将收看的频道固定在某个电视台上的话,就会影响到整个地区的收视率。一直到现在,虽然并没有实际的样本户受贿的案例被爆出,但电视台之间的互相指责却从来没有停止过。这就从一定程度上说明了很大的问题。所以对于百度等互联网巨头来说,这是一个很大的市场。

绿镜数据现在只是作为增值服务提供给合作方,还没有作为产品单独出售。比如爱奇艺在购买《爸爸去哪儿》等网络综艺节目版权的同时,会把绿镜数据的分析结果作为附赠品送给电视台。

这就是绿镜的优势,取样数量很大,数据分析精确度高,一些热门视频的点击量甚至可以达到上千万甚至上亿。随着绿镜精准度的不断提高,这些视频网站的数据慢慢地就会影响到上游的影视内容制作。

很多视频网站都在做这项内容,他们在购买了节目之后,向制作方提供整体的播放量、网友反馈以及某一节目类型的偏好关联,根据这些数据说服制作方对节目内容做出调整。当然了,这需要一定的时间,毕竟在传统制作和大数据的运用之间,还存在着很多的问题,大多数的制作方还是更偏向于传统的做法,比如王凡那样的传统制片人,他会更喜欢央视索福瑞的数据,因为视频网站提供的数据对他来说缺乏权威性。

汤兴讲了一个用户脸谱的概念,他说爱奇艺下一步会细分用户群体,涉及的内容包括观众的性别、年龄、所在地等等。因为针对不同性别和年龄段的用户,喜欢的题材存在不小的差距,地域性也很明显,比如北方的观众更喜欢郭德纲,而南方的观众会倾向于喜欢周立波。脸谱划分完成后,不同的观众收到的推荐内容是不一样的,就算是同一个用户,在PC和手机上的推荐内容也不同。脸谱划分可以提供更精准的数据,仅凭这一点就能够吸引大量的广告投放。

在此之前,各大门户网站在引导用户看节目的时候,通常是后台编辑根据自己的喜好来推荐,在节目上线之前,他们需要看上数遍,从中挑选一些关键点,然后做出吸引人的标题标注在进度条上。“猜你喜欢”就是这个原理,只不过参照的数据是同一个用户在一段时间内的动作。比如一个用户在看完这段视频之后接下去搜索到的视频,数据上关联度越高,就越容易被列到推荐列表上。大数据的算法与点击量息息相关,每一个算法工程师可能只是将推荐的成功率提高零点几个点,但对视频网站整体的流量贡献却可能是几百万、几千万。

透明社会--隐私大爆炸

大数据在带给我们便利的同时,有一个很大的隐患问题--隐私大爆炸。举例来说,假如你删除了电脑上的某个文件,清理了浏览痕迹,觉得自己的隐私得到了保护,但事实上,你的每一个互联网动作都被存放在后台的一个数据库里。世界上的各个角落都有无数台摄像机进行二十四小时的公众区域监视。

这些巨大的商业数据库能够探究你的财务状况,而且只要他们愿意,可以把信息卖给任何愿意付费的人。在全球互通的信息网络里,你的每一次浏览都被记录下来。想知道你的车子开到哪里去了?智能型收费道路就能做到。

日新月异的新科技在更加严重地搜刮我们的隐私。活在这样的一个世界,你会感到紧张吗?很难想象人们的答案是否定的。在大数据时代,我们每个人都是完全透明的人,没有任何隐私可言。

只要掌握相关技术的人想这么干,他就可以把你的一切都晾晒在阳光下面,让全世界的所有人看到。海量的数据,正让监控变得轻而易举,而且监控的成本越来越低。特别是如今我们生活在一个数字化的世界,每个人都像一张名片,被标注上符号,存进数据库。试想一下,你常用的身份证号、银行密码、各种通讯工具的账号密码、手机号等,这些号码如果被一些你并不认识甚至想象不到的人利用,那么,你还有隐私吗?

据悉,我们这个时代的数据量正在以指数形式增长。去年这个数字已经达到了2.8ZB(1ZB=1024GB),而到2015年,这个数字还会翻一番。为这些数字做出贡献的,有3/4的比例是个人创造和数字文件的移动。比如,一个标准的美国上班族每年可以贡献180万MB的数据量,平均每天有约5000MB,这其中包括下载的电影、文档、电邮以及这些数据通过移动或非移动互联网传播时所产生的附加数据量。

这些数据看起来像一盘散沙,不具备任何关联性,然而在庞大的运算能力面前,这些海量数据就得到了高效的整合,它们从每一个小小的细节里体现出了联系。

“棱镜门”事件的爆发,所折射出来的就是对个人隐私权漠视的最强大抵抗。现在越来越多的人喜欢用Facebook,然而你知道吗?Facebook已经实现了对个人信息收集的自动化与实时化。据首次公开募股时的财务档案显示,Facebook上每位用户的图片和视频资料数据量约为111MB,而Facebook的用户数如今已经超过了10亿,算下来,这是整整100PB(1PB=1024GB)的个人信息数据。有了这些数据,我们甚至可以窥探出一个人的未来。

来自美国罗彻斯特大学的亚当·萨迪克和来自微软实验室的工程师约翰·克拉姆发现,他们最多可以预测到一个人在未来80周后可能到达的位置,准确度高达80%。为此,他们在32000天里,收集了307个人和396辆车的GPS数据,并以此建造起一个“大规模数据集”。

在西方国家,消费者的信息监控已经发展为一项规模达几十亿美元的产业。其中的企业基本不受什么监管,即使你是一个很有影响力的人,你的个人信息在交易的过程中卖价也不会超过一美元。

监督和被监督的力量不平衡,那些手中掌握着更强大数据分析能力的大公司以及更强大的政府,因此就拥有了自由利用这些信息而不受监督的能力。

“棱镜门”事件所折射出来的,就是这一潜在的危险。所以不得不说,伴随大数据时代的到来,我们面临的挑战就是需要建立一套新的监督制衡机制,这样才能规范政府的行为,从而建立一个更加开放的社会,减少大数据错误带来的危害。

生活在大数据时代,人们的隐私不经意间就会泄露,传统的保密方式失去了作用。这就要求那些保存和管理信息的企业需要拿出承担责任的态度和勇气,他们将面临更大的责任,而这也应该成为一种新的隐私保护模式:政府不应假定消费者在使用企业的通讯工具等产品时主动透露了自己的隐私,那样就意味着他们授权企业使用这些隐私。

更大的力量意味着更大的责任,现在已经到了那些掌控大数据的大企业和政府负起责任、构建安全、完善保护网的时候了。

面对数据化生活,你做好准备了吗?

20年前的世界,古人无法想象。而今天的世界也已远不是20年前的世界。现在,大数据将掌握我们的一举一动,甚至能够预测出我们的下一举和下一动,这一点也不夸张。

所以,一个很严肃的问题就是:“数据化生活,你真的准备好了吗?”在大数据时代,我们面临着太多的选择。比如早晨起来,该喝什么牌子的牛奶,看什么样的新闻,听什么音乐,甚至于用笔记本还是台式电脑工作,都会构成一种选择的苦恼。与此同时,由于信息太多,更新太快,我们也面临着太多的陷阱,以及海量的商业信息轰炸和各种身份的人向你发送信息。这些不但改变着我们的生活,也在考验你的独立思考、理性决策和创造的能力。

你将如何应对这些目不暇接的变化呢?我的建议就是,即便你不确定自己将如何应对,但至少不要逃避。当生活正大踏步地步入数据化时代时,它也为我们提供了无限的机会,让我们能够利用大数据技术,改善和提升生活的质量。你既可以针对自己,也可以去帮助别人。

比如,牛津大学就成立了英国首个综合运用大数据技术的医药卫生科研中心,通过搜集、存储和分析大量医疗信息,确定新药物的研发方向,从而减少药物开发成本,同时为发现新的治疗手段提供线索。

还有,美国普林斯顿大学的一些学生针对独居老人展开了一项“魔力地毯”计划。具体做法是,在普通的地毯上安装可以记录老人脚步的传感器,当老人在上面走过时,相应的数据会被上传,电脑收到并分析这些数据,然后与老人健康时的脚步相比较,以此来分辨是否需要就医。如果需要,就会自动触发警报,把信息实时发送给附近的医院。

这些都是伟大的创举,这表明除了为企业创造利润,大数据也能无孔不入地改善我们的生活质量,为普通人提供便利。要知道,无处不在的海量信息现在正改变着整个世界和我们的日常生活方式,一场难以言喻的大数据革命已经悄然来临了,它正在接管与掌控我们的生活。

你必须做好准备,而且你也应该积极地行动起来,让数据化生活成为自己的新习惯,改善自己的生活、工作和社交圈。