c++可视化_pandas数据可视化原来也这么厉害
发布时间
阅读量:
阅读量

作者:小伍哥
来源:AI入门学习(公众号)
在python中,常见的数据可视化库有3个:
matplotlib也被广泛认为是数据可视化领域的核心工具包,
也可被视为掌握数据可视化的重要基础,
层次较深,
拥有大量接口(API)的学习难度较大。
Seaborn是一个基于Matplotlib构建的工具包,能够适应大部分的可视化需求。对于特殊的可视化需求,则仍需掌握Matplotlib的基础知识。
PyECharts是一款强大的可视化工具。它具备良好的网页兼容性能力,并且能够实现动态展示效果。其功能分类较为全面,并非仅仅局限于静态的数据展示。例如这个图表展示了数据的趋势分析功能,并非仅仅是一个简单的图形呈现工具。
今天将探讨Pandas的数据可视化功能。作为一个功能强大的数据分析库,在数据处理过程中仅需一行代码即可完成其基本分析任务,并且其生成的图表同样美观且富有信息量。然而与前述几个主流的数据分析工具相比虽然并不如它们那样强大但在某些特定场景下却更具便捷性与实用性
看案例
在pandas中包含11个较为基础的图形可视化方法,还有一些较为复杂的高级可视化技术。我们逐一对其进行研究和实践。
df.plot.bar()
01、柱状图-纵向
df.plot.bar(stacked=True)

stacked=True,画堆叠柱状图
df.plot.barh()

02、柱状图-横向
df.plot.barh(stacked=True)

同样,stacked=True,画堆叠柱状图
df.plot.area(alpha = 0.9)

03、面积图
df.plot.area(stacked=True,alpha = 0.9)

df.plot.area(stacked=True,alpha = 0.9)

04、密度图-kde
df.plot.density()

05、密度图-density
df.plot.density()

06、直方图
换个数据集
df = pd.DataFrame({'A': np.random.randn(1000) + 1, 'B': np.random.randn(1000), 'C': np.random.randn(1000) - 1}, columns=['A', 'B', 'C']) df.plot.hist(bins=200)

df.plot.hist(stacked=True, bins=20)

df= pd.DataFrame(np.random.rand(100, 4), columns=['A','B','C','D'])df.plot.box()

07、箱盒图
df.plot.box(vert=False)

vert=False也可以换成横向
df.plot.scatter(x='A',y='B')

08、散点图
df = pd.DataFrame(np.random.randn(1000, 2), columns=['a', 'b'])df['b'] = df['b'] + np.arange(1000)df.plot.hexbin(x='a', y='b', gridsize=25)

09、蜂巢图
series = pd.Series(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], name='series')series.plot.pie(figsize=(6, 6))

07、饼图
series = pd.Series(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], name='series')series.plot.pie(figsize=(6, 6))

series.plot.pie(labels=['AA', 'BB', 'CC', 'DD'], colors=['r', 'g', 'b', 'c'], autopct='%.2f', fontsize=20, figsize=(6, 6))

08、矩阵散点图
from pandas.plotting import scatter_matrixdf = pd.DataFrame(np.random.randn(1000, 4), columns=['a', 'b', 'c', 'd'])scatter_matrix(df, alpha=0.2, figsize=(6, 6), diagonal='kde')

全部评论 (0)
还没有任何评论哟~
