Advertisement

基于python的超市历年数据可视化分析_超市消费客户画像大数据可视化分析(2)

阅读量:
img
img

丰富网上的学习资料浩如烟海,在知识缺乏系统性的情况下,在遇到问题时仅停留在表面了解而不进行深入研究时,则难以实现实质性的技术进步

需要这份系统化资料的朋友,可以戳这里获取

一个个体的速度较快。然而,在团队合作的情况下,则能够走得更远。无论你是否已经是IT行业的资深从业者或只是出于兴趣想了解该领域的人们。我们热忱欢迎所有对此领域感兴趣的人士加入我们的社群(包括但不限于:技术分享与交流群组、丰富的学习资源库以及职场吐槟能群),共同探索职业发展机会与挑战!

所有这些物品都在美国4个地区的49个州销售,
来着793位客户的5009个订单。

数据集: Superstore.csv 来源:kaggle

一共21列数据,每一列属性描述如下:

复制代码
    Row ID => 每一行唯一的ID.
    Order ID => 每个客户的唯一订单ID.
    Order Date => 产品的订单日期.
    Ship Date => 产品发货日期.
    Ship Mode=> 客户指定的发货模式.
    Customer ID => 标识每个客户的唯一ID.
    Customer Name => 客户的名称.
    Segment => The segment where the Customer belongs.
    Country => 客户居住的国家.
    City => 客户居住的城市.
    State => 客户所在的州.
    Postal Code => 每个客户的邮政编码.
    Region => “客户”所属地区.
    Product ID => 产品的唯一ID.
    Category => 所订购产品的类别.
    Sub-Category => 所订购产品的子类别.
    Product Name => 产品名称
    Sales =>产品的销售.
    Quantity => 产品数量.
    Discount => 提供折扣.
    Profit => 已发生的利润/亏损.
1、数据概览

9994行,21列数据

复制代码
    print(df.info())
复制代码
    <class 'pandas.core.frame.DataFrame'>
    RangeIndex: 9994 entries, 0 to 9993
    Data columns (total 21 columns):
     # Column Non-Null Count Dtype 
    ---  ------         --------------  -----  
     0   Row ID         9994 non-null   int64  
     1   Order ID       9994 non-null   object 
     2   Order Date     9994 non-null   object 
     3   Ship Date      9994 non-null   object 
     4   Ship Mode      9994 non-null   object 
     5   Customer ID    9994 non-null   object 
     6   Customer Name  9994 non-null   object 
     7   Segment        9994 non-null   object 
     8   Country        9994 non-null   object 
     9   City           9994 non-null   object 
     10  State          9994 non-null   object 
     11  Postal Code    9994 non-null   int64  
     12  Region         9994 non-null   object 
     13  Product ID     9994 non-null   object 
     14  Category       9994 non-null   object 
     15  Sub-Category   9994 non-null   object 
     16  Product Name   9994 non-null   object 
     17  Sales          9994 non-null   float64
     18  Quantity       9994 non-null   int64  
     19  Discount       9994 non-null   float64
     20  Profit         9994 non-null   float64
    dtypes: float64(3), int64(3), object(15)
    memory usage: 1.6+ MB
    None
在这里插入图片描述
二、数据预处理
0、导入包和数据
复制代码
    import pandas as pd
    from pyecharts.charts import \*
    from pyecharts import options as opts
    from pyecharts.commons.utils import JsCode
    
    data = pd.read_csv(r'./data/Superstore.csv')
1、列名重命名

重命名后的列名:

复制代码
    data.columns = ['行ID', '订单ID', '订单日期', '发货日期', '发货方式', '客户ID', '客户名称', '客户类型', '国家', '城市', '州', '邮政编码', '所属区域', '产品ID',
                '产品类别', '产品子类别', '产品名称', '销售额', '产品数量', '提供折扣', '利润/亏损']
2、提取数据中时间,方便后续分析绘图
复制代码
    data['年份'] = data['订单日期'].apply(lambda x: x[-4:])
    data['日期'] = pd.to_datetime(data['订单日期'], format='%m/%d/%Y')
    data['月份'] = data['日期'].dt.month
    data['年-月'] = data['年份'].astype('str') + '-' + data['月份'].astype('str')
三、数据可视化
img
img
img

无论是针对初学者的基础知识学习还是资深数据分析师的专业提升需求,《大数据知识体系》都提供了全面覆盖95%以上相关知识点的系统化课程!经过精心设计和组织的系统化课程!

因为文件数量较多,在此仅对部分目录进行了截图展示,并包含以下内容:大厂面经、学习笔记、源码讲义、实战项目、大纲路线及讲解视频;后续内容也会不断更新完善。

需要这份系统化资料的朋友,可以戳这里获取

知识点,真正体系化!**

由于文件数量较多,在这里仅提取并展示部分目录截图作为预览功能的一部分使用示例。这套资源不仅涵盖大厂面经等核心资源库以及技术学习体系中的学习笔记和知识图谱导图,并包括详细的源码解析文档和完整的实战项目案例分析。同时提供清晰的大纲路线规划以及讲解视频辅助学习过程。后续将持续补充更多内容以丰富用户体验

需要这份系统化资料的朋友,可以戳这里获取

全部评论 (0)

还没有任何评论哟~