什么是大数据

作者:余少银
日期:2014/4/10 16:00:45

什么是大数据,百度百科是这样定义的:大数据(big data)或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。而Gartner给出了这样的定义:"大数据"是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。我个人则认为Gartner的定义更为贴切。"新处理模式"是一个很关键的词汇,这也是我所理解的"大数据"区别于传统统计分析等最关键的特征之一。这个所谓的"新处理模式"有两层含义:1、由于海量的数据,需要更高效的存储和处理技术,Hadoop成为了大数据时代的标志;2、大数据明显的标志是数据挖掘和人工智能的紧密结合。除了上面的"新处理模式"上的区别,我个人还认为最主要的区别在于:数据统计分析是基于已有数据的纵向归类,而大数据是基于对已有海量数据的处理,对还未产生的数据作出预测和推荐。数据统计是已经发生的事情,而大数据往往被用于还没有发生的事情预测或者推荐中。

分享