Advertisement

5.数据挖掘建模

阅读量:

经过数据探索和数据预处理之后,得到了可以直接建模的数据。根据挖掘目标与数据形式可以建立分类与预测、聚类分析、关联规则、时序模式和离群点检测等模型。

1 分类与预测

分类与预测是预测问题的两种主要类型。分类主要是预测分类标号(离散属性),而预测主要是建立连续值函数模型,预测给定自变量对应的因变量的值。
1.1 实现过程
(1)分类
分类是构造一个分类模型,输入样本的属性值,输出对应的类别,将每个样本映射到预先定义好的类别。
分类模型是建立在已有类标记的数据集上
(2)预测
(3)实现过程
1.2 常见的分类与预测算法
1.3 回归分析
研究自变量与因变量之间关系形式的分析方法,它主要是通过建立因变量y与影响他的自变量x_i之间的回归模型,来预测因变量y的发展趋势。
1.3.1

2 聚类分析

3 关联规则

4 时序模式

5 离群点检测

全部评论 (0)

还没有任何评论哟~