Advertisement

第一章 数据可视化与matplotlib

阅读量:

第一章 数据可视化与matplotlib

1、数据可视化的概述
数据可视化在维基百科上是这样定义的:指一种表示数据或信息的技术,它将数据或信息编码为包含在图形里的可见对象,如点、线、条等,目的是将信息更加清晰有效地传达给用户,是数据分析或数据科学的关键技术之一。简单地说,数据可视化就是以图形化方式表示数据。决策者可以通过图形直观地看到数据分析结果,从而更容易理解业务变化趋势或发现新的业务模式。使用可视化工具,可以在图形或图表上进行下钻,以进一步获得更细节的信息,交互式地观察数据改变或处理过程。
2、matplotlib概述
数据可视化在机器学习和数据科学中是很重要的组成部分。在数据分析阶段,数据可视化能够帮助我们理解洞察数据间关系;在算法调试阶段,数据可视化能够发现问题,优化算法;在项目总结阶段,数据可视化能够展示项目成果。
Matplotlib是绘制图表的第三方库,可以快速方便地生成高质量的图表,包括直方图,柱形图,散点图,气泡图,折线图,三维图等。
●安装Matplotlib库
Anaconda :安装了anaconda之后,Matplotlib就已经被安装好了
●导入Matplotlib库中的pyplot子库

复制代码
    import matplotlib.pyplot as plt

在pyplot环境中使用Figure对象进行绘图操作,在这种设计下它相当于一个画布区域 因此必须首先初始化该区域

复制代码
    figure( num,figsize,dpi,facecolor,edgecolor,frameon)

★num : 图形编号可为数字或字符串类型
★figsize : 表示绘图对象的宽度与高度
★dpi : 定义了绘图图像的像素分辨率,默认设置为80
★facecolor : 背景色用于填充绘图区域
★edgecolor : 边框色定义了绘制在图形外围的颜色
★frameon : 控制是否显示绘图边框
★添加子标题 title (标题文字)

折线图和柱形图
●line charts and bar charts are essentially scatter plots with adjacent points connected by line segments. They can be created using the plot() function.

plot(x, y, color="blue", marker="o", label="Data Series", linewidth=2, markersize=10)
●条形图(Bar Chart)是一种用于展示不同类别数据相对大小的数据可视化工具,在Python中可以通过pyplot模块中的bar函数实现绘制。

bar( left, height, width, facecolor, edgecolor, label )

Scatter diagram
● Scatter diagram (也称为Scatter plot)是一种用于展示两变量之间关系的数据可视化工具。它能够帮助我们直观地观察变量之间的关联模式及趋势,并可进一步对同类别的样本进行区分(即根据特定属性将样本分为不同类别)。
★ scatter() 函数
该函数用于绘制Scatter plot图形并返回绘图对象。其基本调用格式为:scaler(x, y, scale_factor, color_map, marker_type, label)

本章小结部分

全部评论 (0)

还没有任何评论哟~