Advertisement

厉害了,用Python在Excel表格当中绘制可视化大屏!!

阅读量:

大家新年好哇,今天小编来给大家分享如何在Excel文档当中来绘制可视化图表,并且制作一个可视化大屏,非常的容易,这里我们会用到openpyxl模块,那么首先第一步便是调用该模块来读取Excel文件,代码如下

复制代码
 # 读取Excel文档并且指定工作表的名称

    
 file_name = 'Bike_Sales_Playground.xlsx'
    
 df = pd.read_excel(file_name,sheet_name='bike_buyers')

当然为了保险起见,我们这里还是拷贝一份源数据,并且新建一个新的工作表,代码如下

复制代码
 # 新建一张工作表

    
 with pd.ExcelWriter(file_name,#文档的名称
    
                   engine='openpyxl',#调用模块的名称
    
                   mode='a',#添加的模式
    
                  if_sheet_exists="replace" #如果已经存在,就替换掉
    
                  ) as writer:
    
 df.to_excel(writer, sheet_name='Working_Sheet',index = False)# 设置Index为False
    
  
    
 # 从新的工作表当中来读取数据
    
 df = pd.read_excel(file_name,sheet_name='Working_Sheet')

数据清洗

下一步我们进行数据的清洗,例如去掉重复值、针对一些数值做一些替换,代码如下

复制代码
 # 去掉重复值

    
 df.drop_duplicates(keep='first', inplace=True, ignore_index=False)
    
     
    
 # 针对婚姻状况这一列,“已婚”替换成“M”,“单身”替换成“S”
    
 df['Marital Status'] = df['Marital Status'].replace('M','Married').replace('S','Single')
    
     
    
 # 针对性别这一列,“男性”替换成“F”,而“女性”替换成“M”
    
 df['Gender'] = df['Gender'].replace('F','Female').replace('M','Male')
    
  
    
 # 查看表格的前5行
    
 df.head()
    
  
    
 # 年龄数值的处理
    
 df['Age brackets'] = df['Age'].apply(lambda x: 'Less than 30' if x<=30 else('Greater than 55' if x>55 else '31 to 55'))
    
  
    
 # 通勤距离的数值的替换
    
 df['Commute Distance'] = df['Commute Distance'].replace('10+ Miles','More than 10 Miles')

output

复制代码
 ID Marital Status  Gender  ...  Age  Purchased Bike     Age brackets

    
 0  12496        Married  Female  ...   42              No         31 to 55
    
 1  24107        Married    Male  ...   43              No         31 to 55
    
 2  14177        Married    Male  ...   60              No  Greater than 55
    
 3  24381         Single    Male  ...   41             Yes         31 to 55
    
 4  25597         Single    Male  ...   36             Yes         31 to 55

绘制图表

接下来我们尝试来绘制几张可视化图表,下面所示的代码绘制的是柱状图,而绘制其余两张折线图的代码与下面是雷同的

复制代码
 # 透视表1

    
 # 制作数据透视表
    
 avg_gender_income_df = np.round(pd.pivot_table(bike_df,
    
                values = 'Income',
    
                index = ['Gender'],
    
                columns = ['Purchased Bike'],
    
                aggfunc = np.mean
    
               ),2)
    
  
    
 # 将数据透视表放入Excel表格中,并且指定工作表
    
 with pd.ExcelWriter(file_name,#工作表的名称
    
                     engine='openpyxl',#引擎的名称
    
                     mode='a',#Append模式
    
                    if_sheet_exists="replace" #如果已经存在,就替换掉
    
                    ) as writer:  
    
     
    
     avg_gender_income_df.to_excel(writer, sheet_name='Average_Gender_Income')
    
  
    
 # 加载文档,并且指定工作表
    
 wb = load_workbook(file_name)
    
 sheet = wb['Average_Gender_Income']
    
  
    
 # 创建柱状图
    
 chart1 = BarChart()
    
 chart1.type = "col"
    
 chart1.style = 10
    
 chart1.title = "基于性别与消费数据之下的平均收入"
    
 chart1.y_axis.title = '性别'
    
 chart1.x_axis.title = '收入'
    
  
    
 # 将绘制出来的柱状图放在单元格中去
    
 data1 = Reference(sheet, min_col=2, min_row=1, max_row=3, max_col=3)#Including Headers
    
 cats1 = Reference(sheet, min_col=1, min_row=2, max_row=3)#Not including headers
    
 chart1.add_data(data1, titles_from_data=True)
    
 chart1.dataLabels = DataLabelList() 
    
 chart1.dataLabels.showVal = True
    
 chart1.set_categories(cats1)
    
 chart1.shape = 4
    
 sheet.add_chart(chart1, "A10")
    
 wb.save(file_name)

output
efd438b059d92817abf20780ef8b21e1.png

生成可视化大屏

我们尝试将绘制完成的图表生成可视化大屏,代码如下

复制代码
 # 创建一个空的DataFrame表格

    
 title_df = pd.DataFrame()
    
  
    
 # 将结果放入至Excel文件当中去
    
 with pd.ExcelWriter(file_name,#工作表的名称
    
                     engine='openpyxl',#引擎的名称
    
                     mode='a',#Append模式
    
                    if_sheet_exists="replace" #如果已经存在,就替换掉
    
                    ) as writer:  
    
     
    
     title_df.to_excel(writer, sheet_name='Dashboard')
    
  
    
 # 加载文档,指定工作表是哪个
    
 wb = load_workbook(file_name)
    
 sheet = wb['Dashboard']
    
 for x in range(1,22):
    
     sheet.merge_cells('A1:R4')
    
     
    
 cell = sheet.cell(row=1, column=1)  
    
 cell.value = 'Bike Sales Dashboard'  
    
 cell.alignment = Alignment(horizontal='center', vertical='center')   
    
 cell.font  = Font(b=True, color="F8F8F8",size = 46)
    
 cell.fill = PatternFill("solid", fgColor="2591DB")
    
  
    
 # 将绘制出来的图表放置到Excel文档中
    
 sheet.add_chart(chart1,'A5')
    
 sheet.add_chart(chart2,'J5')
    
 chart3.width = 31
    
 sheet.add_chart(chart3,'A20')
    
 wb.save(file_name)

最后我们来看一下绘制出来的结果,如下所示
ee8e80b3cbc202cefad341713ef5245e.png

最后的最后,我们将上面所有的代码封装成一个函数,方便我们来调用,代码如下

复制代码
 import Bikes_Sales_Report_Automation as auto

    
  
    
 # 填入文件的名称
    
 auto.automate_excel_dashboard('Bike_Sales_Playground.xlsx')

这样我们就可以一步到位创建出想要的可视化大屏了,想要源数据和代码,可以在公众号后台回复【20230126

**NO.**1

往期推荐

Historical articles

17道经典考题,检验你的 Python 基本功

K近邻、SVM、决策树等机器学习算法的应用场景是什么?

用Python处理Excel的14个常用操作!

用Python来创建7种不同的文件格式

分享、收藏、点赞、在看安排一下?
238283e5656a704fc33d5b8fc1023300.gif
ba49c1fa5e06696e3ce742da78e04aff.gif
f5ff168fc91cc7491a7ec60db240e99a.gif
29d2f01cdf68c61bed35bbec4d52d642.gif

全部评论 (0)

还没有任何评论哟~