基于python的超市历年数据可视化分析_超市消费客户画像大数据可视化分析(2)
发布时间
阅读量:
阅读量


丰富网上的学习资料浩如烟海,在知识缺乏系统性的情况下,在遇到问题时仅停留在表面了解而不进行深入研究时,则难以实现实质性的技术进步
一个个体的速度较快。然而,在团队合作的情况下,则能够走得更远。无论你是否已经是IT行业的资深从业者或只是出于兴趣想了解该领域的人们。我们热忱欢迎所有对此领域感兴趣的人士加入我们的社群(包括但不限于:技术分享与交流群组、丰富的学习资源库以及职场吐槟能群),共同探索职业发展机会与挑战!
所有这些物品都在美国4个地区的49个州销售,
来着793位客户的5009个订单。
数据集: Superstore.csv 来源:kaggle
一共21列数据,每一列属性描述如下:
Row ID => 每一行唯一的ID.
Order ID => 每个客户的唯一订单ID.
Order Date => 产品的订单日期.
Ship Date => 产品发货日期.
Ship Mode=> 客户指定的发货模式.
Customer ID => 标识每个客户的唯一ID.
Customer Name => 客户的名称.
Segment => The segment where the Customer belongs.
Country => 客户居住的国家.
City => 客户居住的城市.
State => 客户所在的州.
Postal Code => 每个客户的邮政编码.
Region => “客户”所属地区.
Product ID => 产品的唯一ID.
Category => 所订购产品的类别.
Sub-Category => 所订购产品的子类别.
Product Name => 产品名称
Sales =>产品的销售.
Quantity => 产品数量.
Discount => 提供折扣.
Profit => 已发生的利润/亏损.
1、数据概览
9994行,21列数据
print(df.info())
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 9994 entries, 0 to 9993
Data columns (total 21 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 Row ID 9994 non-null int64
1 Order ID 9994 non-null object
2 Order Date 9994 non-null object
3 Ship Date 9994 non-null object
4 Ship Mode 9994 non-null object
5 Customer ID 9994 non-null object
6 Customer Name 9994 non-null object
7 Segment 9994 non-null object
8 Country 9994 non-null object
9 City 9994 non-null object
10 State 9994 non-null object
11 Postal Code 9994 non-null int64
12 Region 9994 non-null object
13 Product ID 9994 non-null object
14 Category 9994 non-null object
15 Sub-Category 9994 non-null object
16 Product Name 9994 non-null object
17 Sales 9994 non-null float64
18 Quantity 9994 non-null int64
19 Discount 9994 non-null float64
20 Profit 9994 non-null float64
dtypes: float64(3), int64(3), object(15)
memory usage: 1.6+ MB
None

二、数据预处理
0、导入包和数据
import pandas as pd
from pyecharts.charts import \*
from pyecharts import options as opts
from pyecharts.commons.utils import JsCode
data = pd.read_csv(r'./data/Superstore.csv')
1、列名重命名
重命名后的列名:
data.columns = ['行ID', '订单ID', '订单日期', '发货日期', '发货方式', '客户ID', '客户名称', '客户类型', '国家', '城市', '州', '邮政编码', '所属区域', '产品ID',
'产品类别', '产品子类别', '产品名称', '销售额', '产品数量', '提供折扣', '利润/亏损']
2、提取数据中时间,方便后续分析绘图
data['年份'] = data['订单日期'].apply(lambda x: x[-4:])
data['日期'] = pd.to_datetime(data['订单日期'], format='%m/%d/%Y')
data['月份'] = data['日期'].dt.month
data['年-月'] = data['年份'].astype('str') + '-' + data['月份'].astype('str')
三、数据可视化



无论是针对初学者的基础知识学习还是资深数据分析师的专业提升需求,《大数据知识体系》都提供了全面覆盖95%以上相关知识点的系统化课程!经过精心设计和组织的系统化课程!
因为文件数量较多,在此仅对部分目录进行了截图展示,并包含以下内容:大厂面经、学习笔记、源码讲义、实战项目、大纲路线及讲解视频;后续内容也会不断更新完善。
知识点,真正体系化!**
由于文件数量较多,在这里仅提取并展示部分目录截图作为预览功能的一部分使用示例。这套资源不仅涵盖大厂面经等核心资源库以及技术学习体系中的学习笔记和知识图谱导图,并包括详细的源码解析文档和完整的实战项目案例分析。同时提供清晰的大纲路线规划以及讲解视频辅助学习过程。后续将持续补充更多内容以丰富用户体验
全部评论 (0)
还没有任何评论哟~
