ETL数据整合与处理(一)
文章目录
- 引言
- 第一部分:数据导入操作
- 第二部分:创建数据记录
- 第三部分:生成随机数值
- 第四部分:收集系统相关信息
- 第五部分:对数据进行排序处理
- 第六部分:删除重复的数据项
- 第七部分:处理缺失数据(替换NULL值)
前言
提示:以下是本文将涉及的主要内容概述:在人工智能领域持续取得长足进步,在机器学习作为一种核心技术,在各个领域中的应用日益广泛。很多读者已经开始深入学习机器学习的知识,并通过系统的学习来掌握这一前沿技术。本文旨在系统地阐述机器学习的基本概念与核心原理,并通过实际案例来帮助读者更好地理解和应用这些技术。
提示:以下是本篇文章正文内容,下面案例可供参考
一、Excel输入
Excel文档通常以表格形式组织数据,在此架构下信息呈现直观明了,并便于操作。
在传统的文本存储方式中无法实现的功能,在Excel中通过工作表来组织数据存储。
每个Excel文档包含若干个工作表层(Workbook),每个层拥有独特的名称(Sheet名),用于区分不同的数据维度。
为了使学生能够快速浏览和分析考试成绩等关键指标的数据情况,请确保物理科目的成绩被准确提取至对应的分析模块。

1、建立Excel输入转换工程。

2、设置Excel输入组件参数。

获取工作表名称…
获取工作表名称…
输入列表
可用项目
你的选择
获取工作表名称…

(2)、设置选中的工作表参数。单击【确定】按钮

获取头部数据的字段…
字段
获取头部数据的字段…
字段
获取头部数据的 Fields...

3、预览结果数据。

二、生成记录
在数据统计过程中,通常会制作既定的行数与列数的表格来存储统计数据。 为了便于统计1至12个月的商品销售总额,请您按照以下要求进行操作: 首先需制作一个包含商品名称与当月销售总额两个字段的数据表,并根据实际销售情况填充相关数据。 每个月份结束后,请计算并填写该月的商品总销售额,并确保完成全部12个月的数据录入工作。
生成记录

生成记录
生成记录
生成记录
生成记录
生成记录
生成记录

字段
字段
生成记录
生成记录
生成记录

预览§
预览§
输入预览记录数
确定
预视数据

三、生成随机数
生成随机数
生成随机数
生成随机数
核心对象
输入

生成随机数
生成随机数
生成随机数
生成随机数

类型
类型

生成随机数
生成随机数
转换调试窗口
生成随机数

快速启动
快速启动
预览数据
快速启动
快速启动
快速启动

四、获取系统信息
获取系统信息
获取系统信息

获取系统信息
获取系统信息
获取系统信息

获取系统信息
获取系统信息
步骤名称
字段
获取系统信息
获取系统信息

Enter preview size
浏览记录
Enter preview size
确定
预览数据
浏览记录

五、排序记录
排序记录
排序记录
排序记录
排序记录

Excel输入
Excel输入
Excel输入
Excel输入

排序记录
排序记录
排序记录
排序记录
排序记录

排序目录
排序目录
排序目录

排序记录
排序记录
排序记录

六、去除重复记录
去除重复记录
去除重复记录

排序记录
排序记录

去除重复记录
去除重复记录
核心对象
转换
去除重复记录
排序记录

去除重复记录
去除重复记录
去除重复记录
去除重复记录
去除重复记录

去除重复记录
去除重复记录

七、替换NULL值
替换NULL值
去除重复记录
改写内容
替换NULL值
去除重复记录

替换NULL值
替换NULL值
核心对象
应用
替换NULL值
Excel输入
替换NULL值

去除重复记录
去除重复记录
替换NULL值
去除重复记录
去除重复记录

选择字段
选择字段
替换NULL值
选择字段

替换NULL值
替换NULL值
替换NULL值
眼睛
替换NULL值

