数据挖掘的实现流程
发布时间
阅读量:
阅读量
文章目录
- 数据、信息与知识体系的构建
- 数据挖掘实现流程图概览
- 数据准备阶段(第一步)
- 数据挖掘过程(第二步)
- 模型评估与解释(第三阶段)
- 知识应用(第四阶段)
- 总结与展望
1.数据、信息与知识

2.数据挖掘实现流程概览图
这里提供两张图,以下讲解基于第一张图。


3.数据准备(step 1)
Knowledge Discovery in Databases(KDD)被称为知识发现,简称为KDD。KDD处理的对象是大量数据,这些数据通常储存在数据库系统中,且多为长期积累的结果。然而,这些数据往往不适合直接用于知识挖掘,这通常包括进行必要的预处理工作,这一步骤对于后续有效的知识发现至关重要。
数据预处理主要涉及:
数据预处理是知识发现过程的第一个步骤,同时也是其中的关键环节。数据预处理的效果将直接影响数据挖掘的效率和准确性,从而确保最终模式的有效性。
4.数据挖掘(step 2)
数据挖掘是整个流程的核心环节,它基于KDD的目标,确定相关算法的参数设置,对数据进行分析处理,最终提取潜在的知识模式。目前广泛采用的技术包括决策树、分类、聚类、粗糙集、关联规则、神经网络、遗传算法等技术。
5.模型的评估解释(step 3)
通过上述步骤获得的模式,可能缺乏意义或实用性,因此需要进行评估,以确定哪些模式是有效的和实用的。此外,大多数模式通过数学手段进行描述,难以被普通用户理解,仍需将其以易懂的方式呈现给用户。
6.知识运用(step 4)
知识的获得最终目的是为了其应用,而如何使知识得以运用则是KDD的重要环节。在知识的应用方面,有两种主要的方法:其一是仅凭知识所阐述的关系或结果即可为决策者提供支持;其二是通过将新数据与知识结合,可能会引出新的问题,从而需要对知识进行优化。
7.小结
KDD过程可能包含多次循环,每当任何步骤出现与预期目标不符的情况时,就需要返回至前面步骤,重新进行优化和执行。
全部评论 (0)
还没有任何评论哟~
