欢迎来到百文图书馆!包月下载,不限IP,随心所欲!

数据挖掘特点及功能

数据挖掘是以从数据库中发现隐含的、有意义的知识的为目标,可以通过对未来行为的发展趋势做出的预测,得到有预见性基于知识的决策。主要有以下五项功能。

      (1)自动预测趋势和行为。预测是分析数据库内存储的现有的数据,建立相关的模型找出其变化规律,并由此预测出未来数据状态。预测出的结论具有一定的不确定性的,还需要做进一步分析、论证挖掘出的结果是否是正确的、是否全面的。

      (2)关联分析。关联分析的目的是找出数据库中两个或多个变量的取值之间存在某种规律性。由关联分析生成的规则带有的可信度,这是因为,有时知道数据库中数据的关联函数但是却不能确定的,有时根本不知道。

      (3)聚类分析。聚类是按照相似性把数据归纳成若干类别。也就是说,彼此相似数据的在同一类中,彼此相异的数据在不同类中。聚类分析可以建立宏观的概念,发现数据的分布模式和数据属性之间可能存在的相互关系。

      (4)分类。分类就是找出一个类别的概念描述,就是对某类对象的内涵进行描述,一般用规则或决策树模式表示,可以把类对象的特征概括起来,用来构造模型。分类描述的规则是利用通过一定的算法训练数据集而得出,因此,分类可被用于规则描述和预测。

      (5)偏差分析检测。凡事都有可能有例外,比如在分类中的遇到的反常的、不满足规则的特例。在数据库中存储着大量的数据,其中难免会出现一些异常的数据,为了保证数据挖掘得到的结果的准确性,事先必须从把这些出现偏差的数据检测出来,然后给予适当的处理。通常,检测出的所谓偏差是指观测结果与参照值之间有意义的差别。