Advertisement

数据挖掘笔记02_数据挖掘的模式

阅读量:

挖掘的模式

1.类描述的3种方式

复制代码
    (1)数据特征化:进行目标数据的一般特性和特征的汇总;通过查询来收集指定数据;输出方式如饼图、条形图、曲线图、多维数据立方体、多维表等
    (2)数据区分:将目标类数据对象的一般特征与一个或多个对比类对象的一般特征进行比较。
    (3)数据特征化和区分
    
    
      
      
      
    
    AI助手

2.分类和回归

(1)分类:(离散、无序)

识别描述和区分数据类别(或函数)的相关模型或函数,并通过该模型进行未知对象类标号的预测。建立该模型的过程依赖于对训练样本集的分析。

分类方法:

复制代码
    决策树(类似流程图的树结构,每个节点代表属性值的测试,每个分值代表测试结果,树叶代表类或者类分布)
    
    神经网络
    朴素贝叶斯分类
    支持向量机
    K近邻分类
    
    
      
      
      
      
      
      
    
    AI助手

(2)回归

回归用来预测缺失或者难以获得的数值数据值,而不是离散的类标号。

3.聚类分析

该系统基于最大化类内相似性并最小化类间相似性的原则执行聚类操作,并实施分组策略。由这些对象构成的簇(cluster),每个都能代表一个类别。

4.离群点分析

在某些情况下, 数据集中的个别实例可能会表现出与整体趋势不符的行为模式. 这些异常实例通常被称为离群点(outlier). 传统数据分析方法通常将这类不寻常的数据视为噪音或异常值予以排除. 然而, 在某些特定领域(例如欺诈检测), 这类不寻常的事件往往具有重要的实际意义.

全部评论 (0)

还没有任何评论哟~