Advertisement

python可视化直方图的x轴参数设置_Python 数据分析 matplotlib 可视化之绘图

阅读量:

Python 数据分析 matplotlib 可视化之绘图

它是一个基于Python语言的二维绘图库,并支持使用简洁明了的Python脚本进行折线图、直方图、功率谱图和散点图等多种常见图表的绘制。此外,并且语法极为简单。

在Python编程语言中,通过matplotlib模块中的pyplot子模块来进行绘图。该软件不仅可以生成高质量的数据图表与图像,并且还可以用于数据展示与结果可视化。matplotlib是Python领域广泛认可的数据可视化第三方工具;其中matplotlb.pytir被用作生成不同种类可视化图形的具体命令集;类似于简便导入方式:import matplotlib.pyplot as plt。

线形图:

折线图是最基础的数据图形形式, 常用来展示时间序列数据的变化情况. 在制作折线图的过程中, 我们能够清晰地观察到数据随时间演变的趋势特征.

用于在Matplotlib中绘制线图的函数是plot(X,Y),该函数接受X和Y坐标作为输入。其中X和Y轴的坐标数据类型可接受列表、数组以及Series。

例 1: 坐标数据格式为 seriesimportnumpyasnp

importmatplotlib.pyplotasplt

importpandasaspd

data={'name':['Tom','Peter','Lucy','Max'],

'sex':['female','female','male','male'],

'math':[78,79,83,92],

'city':['北京','上海','广州','北京']

}

df=pd.DataFrame(data)

print(df)

#DataFrame 数据的行索引作为 X 轴, math 列索引作为 Y 轴

plt.plot(df.index,df['math'],color='red',linestyle='-',linewidth=3,marker='D')

#通过 plot 函数的 color 参数可以指定线条的颜色,

linestyle 参数可以指定线条的形状,

linewidth 参数可指定线条的宽度,

marker 参数可对坐标点进行标记(默认情况下, 坐标点是没有标记的),

结果:

name sex math city #创建一个 DataFrame 数据

0 Tom female 78 北京

1 Peter female 79 上海

2 Lucy male 83 广州

3 Max male 92 北京

绘制的线性图:

该模型表现出良好的效果

注意: 颜色配置需前置于线条与点样式之前, 颜色、线条与点样式均可放置在格式字符串中.

如: plt.plot(df.index,df['math'],'co-')

运行结果如下:

image

2. 柱状图

2.1 绘制柱状图主要是使用 matplotlib 的 bar 函数:

bar 函数的 color 参数可以设置柱状图的填充颜色,

alpha 参数可以设置透明度,

例如:importmatplotlib.pyplotasplt

data=[23,85,72,43,52]

plt.bar([1,2,3,4,5],data,color='royalblue',alpha=0.7)

运行结果:

image

bottom 参数用于设置柱状图的高度, 以此绘制堆积柱状图;

width 参数 用于设置柱状图的宽度, 以此可以绘制并列柱状图.

grid函数负责生成网格结构, 通过调整参数的特殊配置, 能够生成具有独特风格的网格

例如:importnumpyasnp

importmatplotlib.pyplotasplt

data1=[23,85,72,43,52]

data2=[42,35,21,16,9]

width=0.3

plt.bar(np.arange(len(data1)),data1,color='royalblue',alpha=0.7,width=width)

plt.bar(np.arange(len(data2))+width,data2,color='green',alpha=0.7,width=width)

plt.grid(color='black',linstyle='--',linewidth=3,axis='y',alpha=0.6)

运行结果:

image

Bar 函数的通过 barh 函数可以绘制水平柱状图importnumpyasnp

importmatplotlib.pyplotasplt

data1=[23,85,72,43,52]

plt.barh(np.arange(len(data1)),data1,color='green',alpha=0.5)

如图所示:

imageimportnumpyasnp

importmatplotlib.pyplotasplt

data1=[23,85,72,43,52]

labels=['A','B','C','D','E']

plt.xticks(range(len(data1)),labels)#设置刻度和标签

设置X轴的标签为'Class';通过设置Y轴和图表标题的方法分别给Y轴和图表设置标签

plt.ylabel('Amounts')

plt.title('Example')

#plt.bar(range(len(data1)),data)

plt.bar(np.arange(len(data1)),data1,color='royalblue',alpha=0.7)

plt.grid(color='black',linstyle='--',linewidth=3,axis='y',alpha=0.6)data1=[23,85,72,43,52]

data2=[42,35,21,16,9]

width=0.3

plt.bar(np.arange(len(data1)),data1,width=width,label='one')

plt.bar(np.arange(len(data2))+width,data2,width=width,label='two')

plt.legend()data=[23,85,72,43,52]

labels=['A','B','C','D','E']

plt.xticks(range(len(data)),labels)#设置刻度和标签

plt.xlabel('Class')

plt.ylabel('Amounts')

plt.title('Example')

plt.bar(range(len(data)),data)

forx,yinzip(range(len(data)),data):

plt.text(x,y,y,ha='center',va='bottom')#文本注解 # 第一个参数是 x 轴坐标

第二个参数是 y 轴坐标

第三个参数是要显式的内容importnumpyasnp

importmatplotlib.pyplotasplt

X=np.random.randn(100)

Y=np.random.randn(100)

plt.scatter(X,Y,color='red',marker='D')x=np.random.normal(size=100)

通过调用plt.hist函数绘制直方图(其中x表示数据集变量),并设置 bins参数为30个区间以确定分组数量。通过调用plt.figure函数创建绘图窗口,并设置其尺寸比例为10:6。# fig参数用于指定图表 (整个图) 的长宽比

无法仅凭空 figure 绘制图表;需要使用 add_subplot() 创建至少一个或多个子 subplot 来实现绘图。
当创建 Figure 对象时,应通过 add_subplot() 函数来生成子图,并将其用于绘制图形内容。

ax3=fig.add_subplot(2,2,3)

years=[1950,1960,1970,1980,1990,2000,2010]

gdp=[300.2,543.3,1075.9,2862.5,5979.6,10289.7,14958.3]

ax1.scatter(years,gdp) #选择不同的 ax 控制变量, 即可在相应的子图中绘制相应的图表(散点图, 线形图, 柱状图)

ax2.plot(years,gdp)

ax3.bar(years,gdp)fig,axes=plt.subplots(2,2,figsize=(10,6))

axes[1,0].plot(years,gdp)

axes[0,0].scatter(years,gdp)

axes[0,1].bar(years,gdp)

axes[1,1].hist(years,gdp)years=[1950,1960,1970,1980,1990,2000,2010]

gdp=[300.2,543.3,1075.9,2862.5,5979.6,10289.7,14958.3]

fig,axes=plt.subplots(2,2)

plt.subplots_adjust(wspace=0.3,hspace=0.3)

axes[1,0].plot(years,gdp)

axes[0,0].scatter(years,gdp)

axes[0,1].bar(years,gdp)

axes[1,1].hist(years,gdp)plt.rcParams['font.sans-serif']=['simhei']#指定默认字体

plt.rcParams['axes.unicode_minus']=False旨在防止图像保存过程中由于字体不支持而出现负号-被表示为方块的情况

来源: http://www.jianshu.com/p/3f776226eda5

全部评论 (0)

还没有任何评论哟~