基于python的数据挖掘实验报告_数据挖掘实验报告
市场购物篮分析
经济管理学院
企业管理专业
1306122427
杨欢欢
一、
实验背景
随着社会进入信息化时代,
现代化的企业搜集了大量数据或高维数据,
包括
市场、客户、供货商、竞争对手以及未来趋势等重要信息,但是信息超载与无结
构化,
使得企业决策部门无法有效利用现存的信息,
甚至使决策行为产生混乱与
误用。
通过数据挖掘技术,可以从大量的数据中,
挖掘出不同的信息与知识来支
持决策,必能产生企业的竞争优势。
数据挖掘和知识发现是一个涉及多学科的研究领域。
数据库技术、
人工智能、
机器学习、统计学、粗糙集、模糊集、神经网络、模式识别、知识库系统、高性
能计算、
数据可视化等均与数据挖掘相关。
近年来,
与数据库的知识发现研究领
域已经成为热点,
其中关联规则数据挖掘算法是数据挖掘中的一个很重要的课题,
它是从背后发现数据中的关联或联系。
本实验主要处理描述超级市场购物篮内容(所购买的全部商品的集合)的虚
构数据,
以及购买者的相关个人数据。
目的是寻找购买相似产品并且购买相似产
品的客户群特征。
二、
实验目的
1
、
掌握数据挖掘的基础知识,能够深刻理解并熟练运用
GRI
和
C5.0
规则,能
够熟练运用
SPSS Clementine11.1
软件进行数据分析。
2
、
利用
GRI
和
C5.0
规则对商场客户交易数据进行分析,从中发现客户购买的
商品之间的关联关系,并进一步归纳出购买相似商品的顾客群的特征
。
3
、
理解并操作实验中数据挖掘的两个部分,
一是关联规则建模和一个显示所购
买商品关联关系的网络图;二是
C5.0
规则归纳,显示购买建立的产品组合
的顾客群具有的特征。
三、
操作环境
1
、系统环境:
Windows XP
2
、软件环境:
SPSS Clementine11.1
3
、
软件简介:
作为一个数据挖掘平台,
Clementine
结合商业技术可以快速建立
预测性模型,进而应用到商业活动中,
帮助人们改进决策过程。
强大的数据挖掘
功能和显著的投资回报率使得
Clementine
在业界久负盛誉。同那些仅仅着重于
模型的外在表现而忽略了数据挖掘在整个业务流程中的应用价值的其它数据挖
掘工具相比,
Clementine
其功能强大的数据挖掘算法,使数据挖掘贯穿业务流
