首页>>学生风采>>中山大学南方学院樊枭杰>>观点>>大数据时代的取舍之道

大数据时代的取舍之道

作者:樊枭杰
日期:2014/3/17 22:51:10

最近城市流行微博、微信、微时代/

最近城市流行苹果、小米、低头党/

网络,数据,大时代。年轻人在网中漫步,魑魅魍魉跋扈自恣。

? 不才改编二条河原落书的打油诗,想必在一定程度上反映出当下中国,年轻人中最时髦,最流行的东西。不止是中国,从硅谷到北京,大数据的话题正在被传播。随着智能手机时代的到来,我们生活中的一切数据皆成为了可被记录,可被分析的数据。以此为基础,一个大规模生产、分享和应用数据的时代正在开启。

? 不过正如《大数据时代》的作者维克多所说,大数据的真实价值目前只发现了冰山一角。

? 大数据的出现,使得越来越多的普通机构、企业和部门可以通过分析数据获得知识和提供服务。它标志着一个时代的到来,在这个时代里人类第一次有机会和条件,能够在非常多的领域和非常深入的层次获得和使用全面数据、完整数据和系统数据,获取过去不可能获取的知识,得到过去无法奇迹的商机。

? 但是,能从大数据中发现商机并不容易。我们首先要转变、舍弃的,是我们的观念,那些追求精益数据,追求样本数据准确的观念。

? 在大数据时代,我们需要将注意力放在”是什么“,而不是”为什么“。下面通过一个生动形象的例子来论述这个观点。

? 2009年在美国出现了新型的H1N1流感病毒,这种病毒在短短几周内迅速传播开来,美国的疾控中心希望医生在发现新型病毒病例时告知他们,但是通常人们只有在患病多日才会去医院,这个信息传达回疾控中心时也需要时间,因此当疾控中心得知流感爆发的信息时往往已经滞后了两周。对于流感病毒来说,这个时间是致命的。

? 而在09年这场流感爆发的几周前,互联网巨头谷歌公司居然神奇的预测到了冬季流感的传播,甚至具体到特定的地区和州。它着实令公共卫生官员和计算机科学家震惊了一把,原来谷歌就是运用了大数据--它通过分析每天来自全球超过30亿条的搜索指令,并搜索特定的检索词如”哪些是治疗咳嗽和发热的药“来判断流感是从哪里传播出来的。

? 当然谷歌公司的实际操作要复杂上许多,这里就不一一赘述。只是希望可以通过此例来向大家展示大数据时代所需的取舍之道--可用于研究的数据如此之多,我们不用在追求精确度,同样的我们也不用去追求因果关系,我们关心相关关系就足够了。或许它不能准确的告知我们某事为何会发生,但它会提醒我们这件事正在发生,这样,我们会注意到很多以前从来没有意识到的联系的存在。

? 大数据时代下,如何取舍,且让时间来验证。

?

分享