如何使用zeppelin实现大数据可视化

阅读量：

Zeppelin采用Spark作为基础构建了其数据可视化解决方案，并且能够处理Scala语言以及展示表数据内容。它通过interpreter这一工具实现的数据源扩展功能进一步增强了系统的灵活性与可操作性能力，在GitHub等平台可找到相应插件以满足不同数据库需求

下面着重介绍zeppelin notebook中代码书写：

scala：此interpreter的优势在于能够整合多源数据到统一视图中进行展示。例如，在MySQL、Hive等数据库间实现混合展示效果

Load mysql表，并注册为spark sqlContext同样的表名：

导入java.util.Properties类以获取属性值对象

Hive数据可以直接进行load：

sql(s"""
SELECT
...
FROM table where ...""").registerTempTable("hive_table")

对mysql，hive表进行混合查询，支持下拉框：

.sql(""执行查询...从..."""
+
z.select(“数据来源”, Seq((('MySQL_表1’, ‘MySQL_表1 数据’), ('MySQL_表2’, ‘MySQL_表2 数据’), ('Hive_表’, ‘Hive 数据')))

效果：

在Scala语言中，可以通过以下方法对DataFrame数据进行展示：首先通过SQL查询获取所需数据，并将每一行转换为用制表符分隔的字符串；接着收集这些字符串并将其转换为换行分隔的字符串；最后将生成的结果与预定义的表格头合并输出

全部评论 (0)

还没有任何评论哟~

Zeppelin是基于spark的数据可视化方案。支持scala语言，任何在spark上运行的job都可以在此平台上运行，此外支持对表数据的可视化。对数据源的可视化可以通过interpreter进行扩...

数据的地图可视化展示虽然Zeppelin针对结构化数据默认提供了表格、直方图、饼图、区域图、折线图和散点图共6种可视化方式，但我们通过Zeppelin提供的helium插件功能可以集成更多可视化形式...

python入门教程非常详细 python入门教程如下：准备材料：windows电脑、python1、这里简单告用python软件编写的一个关于货物售价折扣方面的一个计算程序，首先打开python软件...

官网介绍 MultipurposeNotebook TheNotebookistheplaceforallyourneeds DataIngestion DataDiscovery DataAnaly...

前面有篇文章，介绍ZeppelinMySQLInterpreter的功能，可以访问MySQL数据库，并实现数据可视化，今天，有更好更方便的方式来访问MySQL，那就是ZeppelinJDBC方式，当然...

大数据，指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

01echarts简介百度开发团队制作，开源交个apache基金管理制作图表的javascript库同类型产品hightChartsD3 02echarts步骤 1\.初始化 varechart...

echarts中文官网官网链接点击查看：ECharts:五分钟上手echarts webpack是目前比较流行的模块打包工具，你可以在使用webpack的项目中轻松的引入和打包ECharts，这里假...

1：安装Matplotlib 在Linux系统中安装matplotlib Ubuntu17.10内置Python2版本和Python3版本，可以采用下面的方式安装Matplotlib sudoaptg...