首页 > 封面故事 > 正文

大数据,想象力以及正在被改变的世界

2013-12-02 09:40 作者:魏一平来源:三联生活周刊 2013年第48期
世间万物,一切皆可量化,一切皆为数据。数据改变世界,刚刚开始。或许,前提是你需要重置你的想象力。

图景:现实与未来

一、商业——个性交易

亚马逊总裁杰夫·贝索斯说过:“如果我的网站上有一百万个顾客,我就应该有一百万个商店。”现在的零售网站在挖掘顾客偏好的时候主要有两种方式:一种是基于用户,来判断顾客之间的相似性,比如当你在网上买了一本最新的小说,网站就会自动提醒你买这本小说的顾客中还有65%的人买了另外一本。借助“群体的智慧”,让顾客的购买行为来帮助完成“人以群分”。另一种方式是基于商品,通过判断商品之间的关联度来完成推荐,比如当你购买了一款剃须刀,网站自然就会就推荐一款对应的须后水,由此形成“物以类聚”。

这种基于“协同过滤”技术的推荐引擎,现在已经比较普遍,其实,大数据还能做更多。比如,你登录购物网站,浏览了几款商品,但最后没有下单,以前认为这些数据是没用的,不计入交易记录,但其实你的网络路径已经折射了你的喜好,你寻找某一款商品的方式,你在某一款商品上停留的时间多少,都可以推断出你潜在的购买意愿。专门从事推荐引擎开发的百分点公司就是这一领域的探索者,公司创始人苏萌告诉本刊记者:“从数据的价值来看,没买比买了更重要。”

曾在美国学习营销模型的苏萌说,大数据将会实现营销人的终极追求——真正了解每一个人的需求,而不是为群体画像。未来,随着大数据的深度挖掘,很有可能会出现这样一幕场景——你想买一款护肤品,登录购物网站后,还没等搜索,就已经有两款适合你的护肤品显示在页面上了,而且还是你心仪的牌子。为什么网站能了解你的需求,很可能是因为你刚刚在微博上跟朋友讨论起这个牌子的护肤品。当然,如果你不喜欢这种略显“亲密”的销售方式,只需关闭推荐任务即可。

美国妇女尼基·史密斯(左)正在用谷歌翻译软件给领养的女儿讲笑话

如果你厌倦了网络购物,周末想跟家人一起去逛逛超市,大数据照样能够大显身手。大型超市宛如迷宫,商品琳琅满目,很多人不喜欢去超市,主要是因为购物效率太低,找起东西来太麻烦。英格兰最大的连锁超市Stop﹠Shop开发了一套智能购物车系统,他们在超市的购物车上安装了一个计算机,并在超市内部布置了无线网,顾客只需要在会员卡上勾出自己的购物清单,然后在购物车计算机上刷一下,屏幕上就会自动显示出你的“最优购物路线”,通过天花板上的位置追踪系统,指引你到选中的货架面前。另外一家名为Sensory的公司更进一步,正在开发一种可以和顾客交谈的智能系统,取名为“超市阿凡达”。当你站在摆满薯片的货架面前犹豫不决时,购物车显示屏上的“阿凡达”就开口了:“您需要什么样的薯片?”“我想要低糖的番茄味。”很快,阿凡达回道:“在上面第二排靠左边位置,我推荐乐事的。”这背后,依托的就是对大数据快速而精准的运算,因为你的位置信息、语音信息和商品的详细信息,都可以转化成数据。

不单零售业,大数据已经开始影响很多传统行业,比如金融和保险,他们最大的挑战都是风险控制。百分点公司与一家银行合作,利用大数据的方式来筛选网上登记的信用卡申请资料。苏萌向本刊记者介绍,这家银行的信用卡网上申请,只有1/5的人能够通过,之所以通过率很低,是因为信息不对称,仅凭有限的个人资料,银行不敢贸然发卡。因为百分点的个性化搜索引擎与国内几十家电子购物网站都有合作,掌握了丰富的消费者数据,成为筛选信用卡客户的利器。“比如你申请信用卡的这个ID,在过去的两个月内从网上买过一台数码相机、一件品牌服装,就能大概判断出你的消费水平,从而推断你的还款能力。”苏萌介绍说。

另外一家从事大数据业务的天云融创数据公司正在与一家保险公司合作,其CEO雷涛向本刊记者介绍,保险公司很担心客户流失,但对于几十万客户来说,如何判断哪些人有可能流失是个难题。传统办法往往是做抽样调查,形成分析报告,然后找对策、实施、再评估。这样一个流程下来,速度慢,而且效果不可控。现在,借助大数据,保险公司可以通过客户的保险记录,清晰地判断每个人的流失风险,每个销售员手机上都下载了一个客户端,可以轻松查到自己客户的流失风险指数,由他们去对症下药即可,最后再由销售员反馈效果,自动生成评估结果。雷涛告诉本刊记者:“大数据可以让系统生成一个闭环操作,扁平化决策,自动化运行。”

 

高德地图交通信息事业部总经理董振宁

二、医疗——认识自己

大数据在医疗保健领域的应用更加鼓舞人心。认识自己一直是人类不懈的追求,自从1953年詹姆斯·沃森博士和弗朗西斯·克里克博士提出脱氧核糖核酸(DNA)结构之后,基因测序成为人们梦寐以求揭开自身密码的钥匙。但是,基因分析需要超强的计算能力,DNA分子由排列成约30亿个精密序列的化学基础组成,即使是单细胞细菌,大肠杆菌的DNA分子也有足以占据整套《大不列颠百科全书》的信息。乔布斯利用基因测序来治疗癌症的案例已经广为流传,但他花费了十几万美元,最终也只是延长了两年寿命。

现在,随着大数据计算的发展,专门从事基因测序业务的23andMe公司推出了低至99美元的服务。不管你在世界的哪个角落,只需要吐一口唾沫或拔一根头发,邮寄到23andMe位于加利福尼亚州山景城的实验室里,两周后你就可以从他们网站上查询你的“身体秘密”。23andMe公司宣布,通过全基因组上超过100万个位点的基因信息分析,他们可以对259种疾病提出患病率的预测和祖先遗传分析,从而提前干预。仅仅在10年前,这项技术却需要耗费惊人的27亿美元,再加上数百科学家13年的时间。不久的将来,诸如23andMe这样的基因技术公司会越来越多,由此给制药业带来的影响将显而易见,有望实现真正的个性化诊断。

IBM“大数据宝宝”的案例就是其中一个代表。在2010年来中国之前,王晓梅一直待在IBM多伦多实验室里从事传统数据管理工作。在多伦多,有一家全球著名的病童医院,专门收治来自世界各地16岁以下的疑难症病童。王晓梅向本刊记者介绍,在医学领域,如何提高早产儿的存活率一直是医生面临的最大挑战之一。全世界通行的做法是将早产儿放到保温箱里,每隔半小时由护士来记录一次仪器监测数据。但是,早产儿的死亡大多发生在出生后24小时内,因为新生儿的体征表现不明显,加之往往早产儿在病发前几个小时,身体各项指标会表现得特别健康,其实是一种假象。于是,当数据记录发现问题的时候,往往已经错过了最佳的抢救时机。

IBM与这家医院合作,联合安大略省理工学院,共同开发了一套基于大数据技术的新生儿实时监测系统。在早产儿身上贴上传感器,通过它们把表皮以下的体征指数迅速捕捉下来,并且进行实时记录。这样一来,虽然数据量变得庞大了许多,但能够保证数据的准确性与即时性,再通过IBM创造的流计算技术进行实时分析,一旦发现异常,马上介入抢救,大大提高了早产儿的存活率。

 

三、地图——方位魔力

美国海军军官莫里(Maury)绘制的航海图,可能是大数据在地图领域的最早实践之一。1839年,他因为马车翻车导致大腿粉碎性骨折,留下残疾,从此离开了海上生活,美国海军任命他为图标和仪器厂的负责人。传统的航海大多是依靠的老船长的丰富经验,他们大脑里有一张隐形的航线图,每次航行还会带回一沓厚厚的航海日志。这些手绘的航线图和日志尘封在库房里,已经积累了数百年。莫里意识到,如果把它们整理到一起,将有可能呈现出一张全新的航海图。他雇用了20个人来整理数据,把整个大西洋按经纬度划分成五块,并按月份标出温度、风俗和风向,最后绘制出一幅标准的航海地图。他把航海图分发给船长们,要求以他们的航海日志为回报,这样他就能够在新航海图上添加更详尽的数据。

2002年高德地图成立时,电子地图刚刚兴起没多久,现在,基于地理位置的服务(LBS)已经成为移动互联领域的主力之一。借助大数据的相关技术,不仅静态的地图服务越来越精准,动态的交通管理也开始走向智能化。

以北京为例,交通拥堵一直是个头疼的问题,很大程度上,是因为信息技术没有充分利用起来,早晚高峰的时候车辆都集中在主干道和环路上,而作为毛细血管的支干道路车辆却比较少。高德交通信息事业部总经理董振宁告诉本刊记者,经过大数据分析发现,即便在北京最堵车的时刻,比如周五的晚高峰,也只有20%的道路发生严重拥堵,另外80%的道路是顺畅的,甚至有的路上一辆车都见不到。如果有一套系统,能够让大家对全市的交通状况实时掌握,就可以及时调整出行路线,大大节省交通时间。

传统的实时交通监测,主要有两种方式,一种是交通管理部门采用的固定监测法,通过架设在路上的摄像头、埋在路面下的传感器,来监测某一地点不同时段的交通流量。另一种是交通广播电台采用的人海战术,他们在全市发动了几千个交通信息播报员,通过他们人工反馈来实时播报交通状况。但是,这两种方式都面临一个问题——覆盖率不高。现在,有了大数据,我们可以换一种思路——干脆把车子当作一个自动的信息员。

高德地图交通信息事业部总经理董振宁向本刊记者介绍,北京现有出租车6万多辆,基本都装有GPS定位设备,主要用于安防和调度,海量的行驶轨迹数据没有充分利用起来。高德与出租公司合作,选取其中的4万多辆,实时共享他们的行驶轨迹数据,这就意味着在北京布置了4万多个移动的检测器。每隔10秒钟到1分钟,出租车会自动把自己的位置信息发回大数据中心,大数据中心就能自动计算每条道路的实时交通流量。除此之外,高德还通过与新浪微博合作,发动网友实时上报交通事件信息,比如哪个地方发生了交通事故,哪个地方正在修路或有交通管制。只要有人在微博提及这些,大数据中心就能实时捕捉到关键信息,并将这些信息发布到高德地图的客户端上。通过基于Hadoop系统的大数据平台,把实时交通流量信息与交通事件信息、红绿灯延时等信息整合,最后得出一个最优的交通路线,并且预测出每条路线准确的交通到达时间。

这套系统从2007年开始,到现在已经覆盖了全国60多个城市,如果再加上社会车辆的反馈,每天会有7000万~1亿公里的行驶轨迹数据发回高德,每隔两分钟就能刷新一次。除了实时的数据分析,高德还需要对过去3个月的历史交通数据进行分析,从而总结出交通拥堵的规律性,为实时预测提供指导。

海量的道路行驶轨迹数据还为地图绘制提供了意想不到的便利。董振宁告诉本刊记者,中国地图产业的规律是强者恒强,因为中国面积巨大,城市发展太快,地理信息变动太多,每年的地图数据至少有30%需要更新,而在国外,这一数据一般不超过5%。如何能够花费最少的成本迅速找出这些变动的信息并进行更新,便成为地图制造商的核心竞争力。有了这些海量的道路行驶轨迹数据,高德就能够做到有的放矢,比如,有一条路线上留下的车辆位置信息越来越密集,但地图上显示这里并没有路,那很可能就是一条新开的道路。“未来,地理位置的信息将像水电一样成为一种基本的生活资源,可以跟购物、休闲、交通安全等领域进行合作,成为人们生活的一部分。”董振宁向本刊记者展望道,“而所有这些,都有赖于大数据的发展。”

阅读更多更全周刊内容请微信扫描二维码下载三联中读App,注册就有红包哦!

版权声明:凡注明“三联生活周刊”、“爱乐”或“原创”来源之作品(文字、图片、音频、视频),未经三联生活周刊或爱乐杂志授权,任何媒体和个人不得转载 、链接、转贴或以其它方式使用;已经本刊、本网书面授权的,在使用时必须注明“来源:三联生活周刊”或“来源:爱乐”。违反上述声明的,本刊、本网将追究其相关法律责任。
已有0人参与

网友评论

用户名: 快速登录

《立冬》现已上线即刻前往 App Store 搜索“三联生活节气”体验更多精彩。

《霜降》 《寒露》 《秋分》

微博@三联生活周刊
微信:lifeweek
扫描下载三联中读App
三联中读服务号