python可视化直方图的x轴参数设置_Python 数据分析 matplotlib 可视化之绘图
Python 数据分析 matplotlib 可视化之绘图
它是一个基于Python语言的二维绘图库,并支持使用简洁明了的Python脚本进行折线图、直方图、功率谱图和散点图等多种常见图表的绘制。此外,并且语法极为简单。
在Python编程语言中,通过matplotlib模块中的pyplot子模块来进行绘图。该软件不仅可以生成高质量的数据图表与图像,并且还可以用于数据展示与结果可视化。matplotlib是Python领域广泛认可的数据可视化第三方工具;其中matplotlb.pytir被用作生成不同种类可视化图形的具体命令集;类似于简便导入方式:import matplotlib.pyplot as plt。
线形图:
折线图是最基础的数据图形形式, 常用来展示时间序列数据的变化情况. 在制作折线图的过程中, 我们能够清晰地观察到数据随时间演变的趋势特征.
用于在Matplotlib中绘制线图的函数是plot(X,Y),该函数接受X和Y坐标作为输入。其中X和Y轴的坐标数据类型可接受列表、数组以及Series。
例 1: 坐标数据格式为 seriesimportnumpyasnp
importmatplotlib.pyplotasplt
importpandasaspd
data={'name':['Tom','Peter','Lucy','Max'],
'sex':['female','female','male','male'],
'math':[78,79,83,92],
'city':['北京','上海','广州','北京']
}
df=pd.DataFrame(data)
print(df)
#DataFrame 数据的行索引作为 X 轴, math 列索引作为 Y 轴
plt.plot(df.index,df['math'],color='red',linestyle='-',linewidth=3,marker='D')
#通过 plot 函数的 color 参数可以指定线条的颜色,
linestyle 参数可以指定线条的形状,
linewidth 参数可指定线条的宽度,
marker 参数可对坐标点进行标记(默认情况下, 坐标点是没有标记的),
结果:
name sex math city #创建一个 DataFrame 数据
0 Tom female 78 北京
1 Peter female 79 上海
2 Lucy male 83 广州
3 Max male 92 北京
绘制的线性图:
该模型表现出良好的效果
注意: 颜色配置需前置于线条与点样式之前, 颜色、线条与点样式均可放置在格式字符串中.
如: plt.plot(df.index,df['math'],'co-')
运行结果如下:
image
2. 柱状图
2.1 绘制柱状图主要是使用 matplotlib 的 bar 函数:
bar 函数的 color 参数可以设置柱状图的填充颜色,
alpha 参数可以设置透明度,
例如:importmatplotlib.pyplotasplt
data=[23,85,72,43,52]
plt.bar([1,2,3,4,5],data,color='royalblue',alpha=0.7)
运行结果:
image
bottom 参数用于设置柱状图的高度, 以此绘制堆积柱状图;
width 参数 用于设置柱状图的宽度, 以此可以绘制并列柱状图.
grid函数负责生成网格结构, 通过调整参数的特殊配置, 能够生成具有独特风格的网格
例如:importnumpyasnp
importmatplotlib.pyplotasplt
data1=[23,85,72,43,52]
data2=[42,35,21,16,9]
width=0.3
plt.bar(np.arange(len(data1)),data1,color='royalblue',alpha=0.7,width=width)
plt.bar(np.arange(len(data2))+width,data2,color='green',alpha=0.7,width=width)
plt.grid(color='black',linstyle='--',linewidth=3,axis='y',alpha=0.6)
运行结果:
image
Bar 函数的通过 barh 函数可以绘制水平柱状图importnumpyasnp
importmatplotlib.pyplotasplt
data1=[23,85,72,43,52]
plt.barh(np.arange(len(data1)),data1,color='green',alpha=0.5)
如图所示:
imageimportnumpyasnp
importmatplotlib.pyplotasplt
data1=[23,85,72,43,52]
labels=['A','B','C','D','E']
plt.xticks(range(len(data1)),labels)#设置刻度和标签
设置X轴的标签为'Class';通过设置Y轴和图表标题的方法分别给Y轴和图表设置标签
plt.ylabel('Amounts')
plt.title('Example')
#plt.bar(range(len(data1)),data)
plt.bar(np.arange(len(data1)),data1,color='royalblue',alpha=0.7)
plt.grid(color='black',linstyle='--',linewidth=3,axis='y',alpha=0.6)data1=[23,85,72,43,52]
data2=[42,35,21,16,9]
width=0.3
plt.bar(np.arange(len(data1)),data1,width=width,label='one')
plt.bar(np.arange(len(data2))+width,data2,width=width,label='two')
plt.legend()data=[23,85,72,43,52]
labels=['A','B','C','D','E']
plt.xticks(range(len(data)),labels)#设置刻度和标签
plt.xlabel('Class')
plt.ylabel('Amounts')
plt.title('Example')
plt.bar(range(len(data)),data)
forx,yinzip(range(len(data)),data):
plt.text(x,y,y,ha='center',va='bottom')#文本注解 # 第一个参数是 x 轴坐标
第二个参数是 y 轴坐标
第三个参数是要显式的内容importnumpyasnp
importmatplotlib.pyplotasplt
X=np.random.randn(100)
Y=np.random.randn(100)
plt.scatter(X,Y,color='red',marker='D')x=np.random.normal(size=100)
通过调用plt.hist函数绘制直方图(其中x表示数据集变量),并设置 bins参数为30个区间以确定分组数量。通过调用plt.figure函数创建绘图窗口,并设置其尺寸比例为10:6。# fig参数用于指定图表 (整个图) 的长宽比
无法仅凭空 figure 绘制图表;需要使用 add_subplot() 创建至少一个或多个子 subplot 来实现绘图。
当创建 Figure 对象时,应通过 add_subplot() 函数来生成子图,并将其用于绘制图形内容。
ax3=fig.add_subplot(2,2,3)
years=[1950,1960,1970,1980,1990,2000,2010]
gdp=[300.2,543.3,1075.9,2862.5,5979.6,10289.7,14958.3]
ax1.scatter(years,gdp) #选择不同的 ax 控制变量, 即可在相应的子图中绘制相应的图表(散点图, 线形图, 柱状图)
ax2.plot(years,gdp)
ax3.bar(years,gdp)fig,axes=plt.subplots(2,2,figsize=(10,6))
axes[1,0].plot(years,gdp)
axes[0,0].scatter(years,gdp)
axes[0,1].bar(years,gdp)
axes[1,1].hist(years,gdp)years=[1950,1960,1970,1980,1990,2000,2010]
gdp=[300.2,543.3,1075.9,2862.5,5979.6,10289.7,14958.3]
fig,axes=plt.subplots(2,2)
plt.subplots_adjust(wspace=0.3,hspace=0.3)
axes[1,0].plot(years,gdp)
axes[0,0].scatter(years,gdp)
axes[0,1].bar(years,gdp)
axes[1,1].hist(years,gdp)plt.rcParams['font.sans-serif']=['simhei']#指定默认字体
plt.rcParams['axes.unicode_minus']=False旨在防止图像保存过程中由于字体不支持而出现负号-被表示为方块的情况
