powerbi python词云图_Power BI 标签云可视化
网易云课堂帮我们提取了所有课程的评价信息。进而我们可以进行文本分析,并采用标签云方式进行可视化呈现,观察学员们的评价视角。
1、分词与词频统计
生成标签云的过程通常包括以下几个步骤:首先是将这些评论进行分词处理;接着提取出一个个关键的标签;然后统计每个标签的出现次数;最后生成词频表格。
若需将文本进行分词处理,则可借助分词工具辅助操作。经过一番尝试后发现, 多家在线文本分词服务均未提供理想的效果, 实在无法满足需求. 查阅了一些相关资料后发现, 目前尚未找到完全可以直接使用的解决方案. 因此决定放弃寻找现成工具, 转而开始着手自行设计人机结合的手动分词方案, 以期达到事半功倍的效果.
当然也有一定的技巧可循进行人肉分词同样需要掌握一些技巧你需要知道的是并非直接将所有文本粘贴在一起而是要先清除那些不需要的部分随后再将需要用到的内容用逗号进行分离然后只保留那些带有标签的文字部分使用鼠标右键选择粘贴位置并按住键盘左键执行分割操作经过整整一个下午的努力工作量才完成了这项工作
随后将抹完后的结果进行一次替换操作,并将逗号转换为回车换行符以提高阅读体验之后的操作流程将会生成分词标签列表。接着运用透视表功能对数据进行分析并筛选出关键词及其对应的频率数据从而统计出完整的关键词+词频表格这一步骤所得出的数据集即可作为制作标签云的基础数据来源
2、制作标签云可视化
进行文字标签云可视化通常可以通过互联网上的网站完成。例如有Wordle、Tagul和Tagxedo等工具可供使用。在此我们采用Excel中的Power BI工具进行,在此我们采用Excel中的Power BI工具进行
首先,把词频表加载到 Power BI 里,Excel 或 csv 方式都可以。
下一步骤是访问Power BI的应用中心Visuals Gallery界面,在此界面中获取一个自定义的文字云视觉对象,并导入文件WordCloud.1.2.9.pbiviz后即可将其导入PowerBI工作区。
接下来我们可以添加这个视觉元素,在字段设置中选择标签关键字以及词频参数即可完成生成。现在你已经成功创建了一个预设样式的文字云可视化效果。
它包含一些可调节的选项,在General页面中有一个max number参数(词目的最大数),用于指定希望显示多少个标签,默认值设定为200个标签。由于我们当前约有600个词项,在此情况下可以选择将其调整至600。此外,最小字体大小与最大字体大小这两个参数也同样支持配置。
选择是否旋转文字的方向,默认状态下会开启文字旋转变换。如果我们选择关闭旋转变换,则关闭后观察会更加舒适。
数据颜色(Data color),标签云的外观设置(Tag Cloud appearance),这里可以逐一调整(modify),但事实上是不现实的(unrealistic),我们不可能为几百个标签逐一修改颜色(adjust)。你可以通过切换主题 skin(theme)来换一种主题风格(theme style),那么可以一次性全部更换颜色(colors)。不过很奇怪的是PowerBI 居然无法在软件内部选择更换主题(change theme),而是需要自己另外去定制(create custom theme),再导入到PowerBI中(import into PowerBI)。这个设计确实让人觉得有些奇怪(strange)。希望他后面会做的更好。
完成之后,你可以将Microsoft Power BI上传到网络平台,并生成并分享一个公共链接给其他人访问在线
阅读原文
阅读原文
阅读原文
阅读原文
3、标签云印象
这就是我们用 Power BI 制作的一个文字云图的可视化图表。借助这一可视化图表, 我们可以看到各个学员对我们课程的反馈, 最显著的关键点是什么?
实用、专业、高大上、受益匪浅、物超所值、必属精品,等等
我特别喜欢的还有,
工匠精神,职人匠心,精益求精,授人以渔,等等
还有学员留下了非常有诗意和文采的评论:
寻常一样数据图,才有匠心便不同
思路与技巧并重,创意与实战齐飞
曾经沧海难为水,除却巫山不是云
找找标签云里有没有你留下的评论呢:)
衷心感谢各位学生及朋友给予的真诚反馈!我们持续致力于为广大学子打造更优质的课程。
大家可以在微信平台iamExcelPro上操作,并在其中回复"标签云"。访问链接http://pan.baidu.com/s/1jIqmyvc ,下载评论清单与词频统计表文件。实践操作文字云制作的方法,并根据需要调整设置。如果选择在线工具的话,则可以设置图形布局为照片风格。
在实际工作中可能会面临难以获得理想的词频表的情况;你可以通过将产品名称与销量结合的方式制作文字云分析来辅助数据可视化
