2018第九届中国数据库技术大会(DTCC2018)SecondDay
一、前言
今天的会议已进入第二日,在本次大会中让我深思的是如何切实从自身业务着手推动企业大数据应用的需求。探索数据价值如何助力企业的持续发展其核心问题在于企业虽具备丰富的行业积累和实践经验却在数据建设与推广方面存在不足。然而,在多数企业的日常运营中尽管普遍认识到数据驱动发展的潜在价值(如同阿里所在的商业生态系统一样)但在实际操作层面仍面临诸多障碍。
每次IT峰会都会有马云的发言提到'行业危机'这一话题。阿里巴巴正逐步向以数据驱动为核心业务转型的过程中不断寻求突破。对于我们的企业而言,现在是一个良好的时机开始探索如何更好地运用现有的大数据技术来挖掘业务价值才成为所有人共同关注的重点。
二、行程规划
基于自身的行业定位和发展实力,在本次会议的主要议程聚焦于'大数据云服务'以及'机器学习与深度学习'两个领域展开讨论。此次选题的确定是基于当前业务发展需求所作出的战略决策,在大数据云服务领域中能够实现哪些功能?达到什么样的应用水平?其客户价值体现在哪些方面?
1】上午是大会议室专题(公共类),一个专业名词印象深刻——“HTAP”,于是私底下查看了其释义:
该系统能够同时支持在线交易处理(OLTP)和在线聚合分析(OLAP)场景,在一个单一数据源上实现事务一致性的同时提供实时分析能力,并避免了传统复杂的ETL流程
其中以阿里云数据库总架构师的专题讲座尤为令人难忘,以下是其演讲的主要内容

在业内引起了广泛关注的阿里新一代关系型数据库POLARDB凭借其核心优势,在处理大规模数据时展现出卓越的表现。其主要特性体现在将存储与计算分离以及实现了高效的RAFT一致性协议。该系统通过结合新型硬件支持下的RDMA技术,并在软件和硬件层面均展现了领先的技术实力。
2】下午专场
行程规划如下:

在本次大数据云服务专题中, 多位专家将深入探讨轻量化云业务场景、现实中的挑战以及OLAP问题。
在企业级大数据轻量化实践中,主要聚焦于对公有云提供的20+管控服务实施轻量化优化,以实现其高可用性、可升级性和可扩展性的目标.这些优化措施特别针对基于小规模数据的应用场景提供支持的大数据分析实践.具体而言,这项工作主要围绕原有大数据平台的功能进行适配性改造,并推行全零屏化运维模式.这些努力不仅服务于现有业务需求,也为未来的发展方向——DataWorks(数据工作台)这一智能化运维平台的构建与优化奠定了基础.
2、在Apache Kylin云上大数据交互分析实践中着重讲述了Apache中开源OLAP分析工作Kylin这一技术方案。该方案特别适用于复杂分析场景下的高维数据处理(如60+维度数)、雪花模型以及子查询等多种应用场景,并支持ANSI SQL查询接口以及能够直接与BI工具实现对接。实践表明,在处理大量数据的查询分析时表现出色,并且所有查询均在1秒内完成。然而,在增量计算和多表联查等方面仍存在一些问题。
在现有数据资源的基础上开展机器学习与深度学习相关研究的诸多企业,在构建用户行为模型的同时运用深度学习技术实现业务优化目标。例如:阿里在内容产业AI应用方面的探索中发现,在当前多媒体产业场景下通过对媒体内容(包括其自身以及生态系统的相关内容)进行分类整理以及多维度信息分析的基础上结合深度学习算法实现精准的内容素材推荐;而在智能揽客营销方面则是通过构建消费者与其产品的互动关系网络并利用机器学习技术深入挖掘消费者行为特征进而实现精准定位目标消费群体并对商户提供针对性的产品推荐以提升营销效果。
会议现场场景如下:



三、会议感受
我认为充分利用现有大数据技术和上层业务数据进行建模来引导产业方向是企业在未来深入探索时需要考虑的核心问题。当数据体量不足以支撑复杂分析时,则应将重点放在成为本领域内的专家上。这比盲目追求大数据应用更具战略意义。充分利用OLAP层次技术以及数据建模方法是未来在非互联网环境下的企业进行大数据应用的主要思路和方向。
以上仅为个人观点,非喜勿喷!
 GodBlessToNo1
 20180511
