电子信息工程
数据挖掘是在大量的数据中挖掘感兴趣的信息的过程,可以认为是数据库技术与机器学习的交叉,它利用数据库技术来管理海量的数据,并利用机器学习和统计分析来进行数据分析
我们虽然拥有丰富的数据,但却缺乏有用的信息。
在大量的数据中挖掘感兴趣的信息的过程称为「数据挖掘」。因为隐藏在数据之后更深层次、更重要的信息能够描述数据的整体特征,可以预测发展趋势,在决策中具有重要价值。
从大量的数据中挖掘哪些令人感兴趣的、有用的、隐含的、先前未知的和可能有用的模式或知识称为「数据挖掘」。其定义暗含了以下意义
数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。
数据挖掘所得到的信息应具有先前未知,有效和可使用
数据挖掘的任务可分为两大类:分类预测型任务和描述型任务