数据挖掘技术

作者:陈慧礼
日期:2011/11/9 16:39:16

数据挖掘

    数据挖掘(Data Mining)就是从大量的、不完全的、模糊的、有噪声的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的非平凡过程,这些信息的表现形式为:规则、概念、规律及模式等。决策者使用它分析历史数据和当前数据,提取出隐藏的关系和模式,对未来发生的行

为进行预测。

   现代商业信息环境下,数据挖掘属于一种全新的信息技术处理方式,具有多种综合性功能:

1)分类功能:运用数据挖掘处理方式,根据不同分析对象的属性、特征,可以甄别和划分不同的组类来描述相关事物。

2)聚类功能:按照识别出的不同分析类别,针对其内在的规律,再按照相关规则把分析对象归纳为若干类型。

3)预测功能:是指运用数据挖掘分析方式,针对相关分析对象的运行规律进行掌控,同时对未来的发展趋势做出一定性预见。

4)关联规则:关联规则是在同一事件中寻求不同项之间的相关性,通过关联规则可以明确消费者的意向,促进商业运行的发展。

5)偏差检测:通过针对相关少数、极端的特例描述,进行数据挖掘和分析,揭示其内在的原因与规律,寻求存在的偏差。

6)序列模式:序列是一种纵向联系,它反映的是不同事件在时间上的落差性,可以有效的分析商业数据在时间上的相关性。 

 

  数据挖掘和数据仓库的协同工作,不仅提高了数据挖掘的效率和能力,确保了数据挖掘中数据来源的广泛性和完整性;而且数据挖掘技术已经成为数据仓库应用中极为重要的方面和相对独立的工具。

分享