Advertisement

11万字智慧政务大数据平台底座、数据治理、数据中心建设方案WORD

阅读量:

资料来源均为网络平台提供,并旨在供学习交流使用。如有版权相关问题,请各位耐心配合并予以协助删除。感谢大家的关注与支持!为了方便查阅,请您关注订阅号"智慧方案文库"(订阅号:智慧方案文库),这里有大量优质的学习资源可供参考。觉得不错的朋友也可以收藏起来并分享给更多有需要的人哦!

资料内容如下:

目 录

第一章 项目概况

1.1 项目名称

1.2 项目单位

1.3 项目建设依据

1.4 项目建设内容和目标

1.4.1 建设内容

1.4.2 建设目标

1.5 项目投资估算及建设周期

1.5.1 项目投资估算

1.5.2 服务周期

第二章 现状

2.1 项目单位概况

2.1.1 单位职责、内设及下属机构、人员编制和业务情况

2.1.2 拟建项目与项目单位职责、业务的关系

2.2 信息化现状

2.2.1 本单位或本领域信息化建设的整体框架规划或设想

2.2.2 现有应用系统的情况

2.2.3 拟建项目与已有系统的关系

2.2.4 现有网络、设备以及其它信息资源情况

第三章 项目的需求分析

3.1 项目建设的背景

3.2 项目建设的依据

3.2.1 《XX公共数据和一网通办管理办法》(X府令9号)

3.2.2 《XX加快推进数据治理促进公共数据应用实施方案》(X委办8号)

3.2.3 《XX公共数据质量管理暂行办法(征求意见稿)》(X数函〔2019〕14号)

3.2.4 《2020年XX深化“一网通办”改革工作要点》 (X委办〔2020〕12号)

3.2.5 《关于加强数据治理促进城市运行“一网统管”的指导意见》(X委办〔2020〕24号)

3.3 项目建设的必要性

3.3.1 业务现状、存在的具体问题和业务目标

3.3.2 业务对信息系统的具体需求

3.3.3 成果应用效果、推广设想、可持续发展情况

3.4 用户和业务流程分析

3.4.1 用户分析

3.4.2 现有业务流程

3.5 平台性能需求分析

3.5.1 平台存储能力要求

3.5.2 平台数据计算/并发能力要求

3.5.3 平台门户使用要求

3.6 业务量需求分析

3.6.1 业务量分析

3.6.2 数据存储量分析

3.6.3 数据存储部署资源分析

3.7 硬件设备需求分析

3.8 功能需求分析

3.8.1 大数据底座

3.8.2 数据采集子系统

3.8.3 数据治理子系统

3.8.4 数据资源中心

3.8.5 数据共享子系统

3.8.6 门户子系统

3.8.7 统一运维子系统

3.8.8 数据安全管理子系统

3.9 数据分析

3.9.1 数据流程和属性分析

3.9.2 数据量分析

3.9.3 信创适配分析

3.10 满足应用的需要

第四章 项目建设方案

4.1 建设目标

4.2 总体架构

4.2.1 总架构图

4.2.2 平台架构关系

4.3 建设内容

4.3.1 大数据底座

4.3.2 数据采集子系统

4.3.3 数据治理子系统

4.3.4 数据资源中心

4.3.5 数据共享子系统

4.3.6 门户子系统

4.3.7 统一运维子系统

4.3.8 数据安全管理子系统

4.4 应用系统

4.4.1 大数据底座

4.4.2 数据采集子系统

4.4.3 数据治理子系统

4.4.4 数据共享子系统

4.4.5 门户子系统

4.4.6 统一运维子系统

4.4.7 数据安全管理子系统

4.5 资源中心建设

4.5.1 中心总体定位设计

4.5.2 XX市级数据湖

4.5.3 杨浦基础库

4.5.4 杨浦主题库

4.5.5 杨浦专题库

4.6 配套实施工作(三清单一目录)

4.6.1 概述

4.6.2 工作范围

4.6.3 梳理思路

4.6.4 梳理工作开展

4.6.5 梳理工作要求

4.7 网络系统

4.8 服务器和存储系统

4.9 系统软件

4.10 信息安全保障方案

4.10.1 安全体系总体设计

4.10.2 各层级的安全策略设计

4.10.3 安全管理要求

4.10.4 应急保障预案

4.11 数据管理方案

4.11.1 数据来源

4.11.2 数据更新机制

第五章 项目实施进度和组织安排

5.1 项目建设周期

5.2 实施进度计划

5.3 责任人和组织保障

5.3.1 项目领导机构

5.3.2 项目实施机构

一.1.1 大数据底座

搭建统一化的大数据核心支撑架构以实现全面的数据管理功能其中包含多维度的数据存储优化方案支持高效的数据处理与运算流程具备多层次的数据分析技术能力提供智能化的数据安全管理机制**并具备系统的数据运营支持保障

构建统一多tenant架构以促进跨大数据域的服务管控能力优化,并构建针对组件资源的事后运营分析体系以深入掌握各租户分配状态与资源利用情况;制定并建立完整的租户运营工作流程旨在实现 tenant 资源配置与服务分配过程中的统一化管控目标,并要求各类人员需具备标准化的服务操作规范;赋予系统用户角色清晰的安全权限配置策略能够有效保障各层级用户对核心业务系统的访问需求;完成基于微服务架构下复杂场景下的实例部署过程中的关键环节,并确保系统能够对不同维度的安全权限需求进行动态匹配与响应;同时具备对复杂场景下的权限细化控制能力以满足各类业务系统安全策略的具体化实施需求

构建统一化的多租户架构,并通过整合Hadoop、Kubernetes和数据中台技术来实现企业级的全方位的能力支持体系

Ø 建设资源服务目录,实现Hadoop组件HDFS、Hive、HBase、Yarn及Kafka的接入。

该系统将具备相应的功能模块以支持租户资源管理和实例创建,并负责协调区大数据中心与区委办公室之间的资源配置统一管理。该系统将提供实时监控功能以及规范化的人力资源管理体系。

该系统具备对资源进行细致层级划分的能力,并赋予组件基于精细层次结构的权限配置。该方案允许系统对各层级权限设置灵活调整,在保障安全的前提下提升系统的安全性。同时该方法还能够增强系统对数据与资源访问和操作的安全防护能力,并确保数据和资源能够方便地与其他系统交互共享。

为平台运营管理提供支持,并通过线上方式完成租户管理及分析,并实施用量预警以保障运营效率

一.1.2 数据采集子系统****

为全区各委办单位提供数据信息收集功能的实现任务。该系统将采用离线、准实时及实时三种不同方式,并结合各委办单位的具体业务数据特征来完成相应的技术开发工作。

在数据采集过程中(段落开始),政府机构提供的多源(主语转换)信息涵盖了视频监控、物联网感知等技术手段获取的数据,并包括传统政务公开渠道的数据(插入具体的技术手段),这些不同来源(主语转换)与技术手段(插入技术属性)共同构成了复杂的信息网络(插入信息网络的概念)。在此基础上(逻辑连接词),由于各系统运行环境与设备配置存在差异性特征(名词性状转换),导致获取到的原始信息呈现多样性特征(名词性状转换)。因此,在整合过程中需要实施标准化处理工作(动宾结构变化),以确保后续系统的高效运行与功能发挥(逻辑关系调整)。

大数据存储方案:支撑现有应用积累海量结构化数据与半结构化数据,并能够处理包括成套图片、视频资料等非结构化数据在内的 storing 大量信息的能力。要求构建的大数据分析基础平台必须采用分布式文件系统来处理汇聚而成的各种类型海量数据。

数据分析计算:大数据平台的处理效率与精确度对于提升实际应用的及时性和高效性具有决定性作用。该系统能够根据不同业务场景灵活配置数据处理模型,并通过分布式计算实现大规模数据批量处理能力;同时支持流式计算技术以保证实时数据处理能力;此外还具备内存优化技术以提升资源利用率和响应速度。通过这些技术手段的大规模数据处理不仅显著提升了政府部门的数据决策效率还增强了其整体运营效能。

分布式资源配置与调度:在Hadoop 2.0中存在一个资源管理系统作为通用的资源配置模块,并能够为各类应用场景完成相应的资源配置与调度任务。

大数据集群运维管理的主要功能是作为运维系统的延伸模块,在为其数据基础支撑子平台提供高可靠性保障的同时具备安全性保障机制,并且能够实现容错性和易用性。该系统能够实现对大规模集群进行安装操作,并定期执行升级操作以及及时应用补丁更新;同时包含配置管理和监控两大核心功能模块;并且具备告警管理和通知两大核心功能。

一.1.3 数据治理子系统

搭建一个大数据治理子平台,并涵盖以下功能模块:数据标准管理、元数据管理和数据质量控制相关功能。该子平台将具备规范管理和持续优化的能力,并提供一套完整的数据显示和处理方案。具体而言,在本次杨浦大数据资源平台建设项目中,“大数据治理子平台”将包含以下内容模块:“标准化的数据接入和处理机制”以及“支持业务数据分析的应用平台”。该系统将具备强大的数据分析能力和可视化展示功能,并能够高效地完成归集后的数据清洗与加工任务。”

支持全面的资源管理功能体系

数据标准管理:包含数据分析规范功能;其中涉及的内容包括:数据字典规范、字段命名规范、维度定义规范以及数据项定义规范;

该系统支持以下功能模块:前馈收集(实现元数据正向采集)、持续更新维护(对应元数据维护)、动态信息检索(替代元数据查询)、文件交换机制处理(包含元数据导入/导出)以及关系网络分析(涵盖元数据血缘分析)。

数据质量管理:包含数据质量管理功能模块,涵盖以下核心功能:基于需求的质量模型搭建、完善的质量规则制定与执行体系、方案设计与实施安排、质检过程结果核对与分析以及分析报告生成与应用;

数据开发平台:支持数据开发平台功能,并采用可视化编排和原生态构建两种开发方式;实现了原生态开发与可视化编排之间的相互转换。

统一调度管理:包含统一调度管理功能,并涵盖流程设计及管理、调度策略的管控、任务调度控制等功能模块

一.1.4 数据资源中心****

就本次项目而言,在区域内推行标准化建设工作至关重要。本项目组现决定规范全区公共数据的汇聚工作,并建立统一的管理制度。具体而言,在整合各区政府机构的公共数据的基础上构建XX市的数据资源库。经过对收集到的数据实施清洗、转换、融合以及治理等处理流程后,最终产出一批高质量的公共数据中心资源。

依托全区构建的数据资源湖体系,在对收集上来、经过清洗整理后的各项业务数据进行共享与应用需求分析的基础上,按照统一的主题进行分类整理后形成专题数据库和主题数据库,并向政府部门和社会公众开放获取。我们计划持续推进杨浦大数据应用探索工作,在针对跨部门协作、跨领域融合以及跨行业合作的数据应用需求上,通过建立数据关联机制、实现数据融合处理以及进行衍生计算生成相应的算法标签,并在此基础上逐步构建不同领域对应的应用专题或主题数据库,并致力于为全区多部门提供统一规划下的资源共享与协同服务。在本次建设中,具体包括:

  1. 数据资源门户的建设内容;

规划与建设XX市级数据中心:为全区范围内的各类公共数据提供汇聚、存储、处理和计算平台支持,并基于部门类型和数据源类型划分不同区域的数据服务空间

Ø 实现数据对接工作:针对区各委办业务管理系统、XX大数据资源平台以及物联网相关的各类数据进行对接,整合各类业务系统中的原始数据, 构建全区统一的数据共享平台;

搭建全区统一的人口综合管理平台

搭建主题数据库:涵盖全区产业经济领域的一体化主题数据库、电子证照服务系统、权力运行机制数据库等, 为全区产业经济相关数据应用提供支撑。

Ø 主题库

基于跨部门协作、跨领域整合以及多行业协同的应用服务平台,在实现数据关联、融合以及衍生计算的基础上,构建智能算法标签库并打造顶级智能化数据服务系统。主题库旨在支持特定大型领域内的业务协同共享方案建设,在大数据主管部门统筹协调下,需多部门共同参与才能完成联合数据分析与知识挖掘任务;为此目标而设立的主题资源库将被系统性地开发并搭建全区范围内统一的数据资源共享平台

为了解决当前XX市面向企业法人的服务存在基础数据缺失的问题,本次项目计划建立XX市企业精准服务主题库

Ø 专题库

专注于特定领域专题应用的数据服务系统通常由各个委办局自主负责开发;在实际操作中也可以根据具体情况委托给大数据中心进行代建和运营支持。
这类专题数据一般不具备支撑大型跨领域或跨行业超级综合应用的功能,并非向外部部门提供数据服务;其主要作用是满足各相关部门内部的需求。

一.1.5 数据共享子系统****

为了尽量避免同一委办机构的大数据服务中重复搭建相同的共性模块,在确保对外服务能够遵循标准化流程、采用安全防护措施,并通过快速复制成功案例来优化服务质量的同时,最大限度地激发外部开发机构的潜能。尽量避免同一委办机构的大数据服务中重复搭建相同的共性模块,在确保对外服务能够遵循标准化流程、采用安全防护措施,并通过快速复制成功案例来优化服务质量的同时, 最大限度地激发外部开发机构的潜能.

尽量避免同一委办机构的大数据服务中重复搭建相同的共性模块, 在遵循标准化流程的同时, 采用先进的安全防护措施, 并通过快速复制成功案例来提升服务质量。为此, 我们需要建立一个涵盖多种功能的基础平台, 以确保平台具备高效的数据交互机制和智能化的数据分析能力.

搭建数据共享平台旨在整合功能模块与接口规范,在政务服务、市场监管、城市管理以及社会治理等多个领域探索推进公共数据资源共享项目,并构建起支持区域间协作发展的基础数据网络

涵盖数据交互与服务管理的系统,在支持通过下发结构化库表实现文件分享的同时,提供了文件共享、API接口交互以及非结构化资源分发等功能。

一.1.6 门户子系统****

以XX市大数据资源平台项目为基础拓展功能模块。主要包含消息推送与数据推送两大类功能,并涉及个人信息管理和系统管理等多个方面。

搭建数据开放平台:主要包含数据目录系统建设、标准化接口服务开发以及多维度的数据应用支撑体系。涵盖包括但不限于业务流程申请提交与管理模块优化设计以及数据分析结果展示分析功能完善等各项核心功能模块的构建

Ø 分析、统计、展示功能

对共享数据和归集数据进行统计汇总,并展示结果。建立填报审批机制,并对统计分析的数据实施双重审核。通过多级审核程序完成数据的全面把关。动态监控关键绩效指标(KPI)并实时更新关键指标预警信息。基于实时更新的数据开展深入挖掘分析需求,并通过多维度视角实现层次化数据分析,并生成直观的可视化图表以辅助决策参考

Ø 查询及业务流程申请功能

当委托方向大数据中心提出数据查询请求时,则必须经过申请审批程序完成数据资源共享工作;获得批准后方可向委托方提供数据查询服务。以便满足委托方对于特定项目或类别数据的需求。

大数据中心与委办之间的管理流程实现对接,在具体操作中需确保各环节衔接顺畅。当委办机构在提出需求时需先进行数据项查询后方能提交相关申请文件;对于采用 3S 单一目录式的申请请求,则可直接进入登记环节无需额外操作即可完成登记

一.1.7 统一运维子系统****

为确保杨浦大数据资源平台高效稳定运行提供支持,在该平台下构建标准化的监控管理系统,并实现对云资源、应用以及业务对象的性能数据进行集中管理和实时监测。系统能够有效识别异常状况及潜在风险,并对云管理运行过程中的监控及容量使用情况等运维数据进行深入分析与预测。同时建立统一的数据资产可视化管理系统,在该平台上实现对数据生产全过程的有效监控,并完成对数据资产血缘谱系及信息资源目录的统一管理和优化配置。

一.1.8 数据安全管理子系统****

该平台需构建全面的安全防护体系,在数据流动全生命周期实施动态安全管理机制。
通过部署多层防御结构及智能化安全评估系统,在网络接入层面构建多层次安全防护屏障。
基于实时监测技术与智能分析算法,在数据存储环节实施智能风险预警机制。
通过身份认证与权限管理模块,在数据传输层面构建动态变更的安全访问控制模式。
运用统一安全服务接口,在数据处理环节提供便捷的安全服务接入方式。
基于行为分析技术与威胁情报评估机制,在数据归档阶段建立完善的数据恢复应急响应流程。
通过漏洞扫描与渗透测试相结合的方式,在数据存储环节实施精准风险定位能力。
基于事件日志分析技术与历史数据分析方法,在数据应用层面构建可追溯的数据安全管理信息库。

一.1 数据分析  ****

一.1.1 数据流程和属性分析****

各区政府及下属机构均直接承担着形成本地区数据资源的基础作用,并将在本次建设工作中纳入本次建设工作的统一数据平台系统中进行整合与管理。建立的这一机制将严格按照国家 data resource directory 的规定执行动态更新与共享任务

一.1.2 数据量分析  ****

Ø 数据汇聚接入、数据交换用户

目前通过数据汇聚和共享交换实现服务的对象包括75家区直部门和社会组织以及12个街道办事处;通过实时对接的方式实现自动化接入。按人均计算每位委办可支持约5名工作人员。由大数据中心管理的20名技术员负责维护日常运营工作。预计总人数将突破400人。基于当前业务规模的扩展趋势预测未来三年内可望达到600人以上

一.1.3 信创适配分析****

1、市平台建设初期,市大数据中心无AK基础设施环境,包括:

服务器、操作系统、数据库、中间件,且目前AK云仍在建设起步阶段;

市平台目前采用的技术方案涉及开源框架和部分数据库以及数据湖产品,在AK名录的官方收录范围内未被包含。

基于其规模宏大且性能标准较高的特点,在现有条件下,市平台目前尚未采用AK方式进行建设,并且目前尚未有改造规划

市平台一期工程已完成并通过验收,并于当前状态稳定运行,在推动全市大数据工作发挥着核心作用。区大数据资源分平台的技术架构遵循标准格式的市平台,在基础设施配置、选型决策以及性能指标等方面整体上未能全面满足AK的要求。项目现阶段完成度有限,在满足必要技术和硬件条件后可在相关领域达到AK标准之前进行适配并做好迁移工作

一.2 满足应用的需要****

对于包括但不限于一网通办、一网统管等特殊应用场景,平台能够提供各部门政务应用系统与数据资源池之间的直接双向交互功能,并非依赖于中间的数据湖中转环节;此外,该平台还具备灵活配置交换链路的能力,在调度引擎的控制下实现高效的业务流程处理。

第二章 项目建设方案****

二.1 建设目标****

杨浦大数据资源平台项目建设的主要任务是致力于构建一个统一的大数据资源管理系统,并通过技术创新实现基础功能架构的完善;同时将制定相应的管理办法以规范操作流程,并为全区各政务部门提供数据共享的支持;其次将设立一个高效的大数据资源服务中心负责标准化数据仓库的建设工作,并开发多层次的数据存储与分析平台;这些努力将为全区的政治治理、经济活动、社会服务以及城市治理等方面提供强大的数据支持。

本次项目的具体目标在于通过建设一期的大数据资源平台来实现对市级大数据资源平台的支持,并在此基础上推动各区级数据平台的协同发展。该计划旨在打造覆盖区级层面的数据采集、治理和共享体系结构,并整合成包含'三清单一目录'及综合数据库的统一管理架构。与此同时, 与各区级委办单位建立协同联动机制, 通过提供全面覆盖'一网通办'及'一网统管'两大网络建设所需的数据支持服务, 从而有效满足上级部门的工作需求, 同时优化区内数据运营考核指标体系

搭建统一的大数据资源管理与应用平台:打造一个包含数据支撑型基础、智能化数据采集与管理系统、标准化数据整理治理模块、高效的数据共享与交换平台以及专业化运维体系的核心资源管理信息平台,并使其具备大数据综合管理与服务功能。

启动建设杨浦大数据资源中心:规划并实施标准化数据仓库的设计与建造工作,并同时完成与其他区级委办业务管理系统、XX大数据资源平台及物联网相关平台的数据对接工作,在整合各类业务数据的基础上最终形成一个 Y 大型的数据资源整合平台

基于现有的杨浦资源中心数据湖平台之上,在此基础上搭建核心数据库系统,并包含人口统计信息库、法人资料整合库、电子证件索引库以及地理空间信息平台等子系统。该系统旨在服务于全区所有政府部门,在人口统计、法人资料查询、电子证件管理以及地理空间信息方面提供全面支持

基于位于杨浦的资源中心数据湖和基础库,在这一过程中基本上完成了对全区一网通办、一网统管、城市规划以及应急指挥等多个领域的资源整合工作,并成功构建了相应的专题数据库和主题数据库。

构建全区统一的数据信息资源体系,并推行动态更新机制。明确全区各级部门之间的共享数据范围,并制定相应的标准和流程;同时建设统一的管理平台及数据中心;通过平台实现上下级部门间的垂直共享;同时实现部门间横向数据的互联互通;最终促进部门间业务协同与高效的指挥联动。

l 充实现有管理功能,形成共享工作体制和制度。

二.2 总体架构  ****

杨浦大数据资源平台以基础设施为支撑(网络、技术和存储),遵循相关技术标准规范并建立信息安全保障体系的基础上构建了涵盖基础数据库和融合数据库的数据支撑底座,并实现了与其他XX大数据资源平台的数据共享与互换

0aff401c86736e269ee2122f100f411a.jpeg

二.2.1 总架构图****

本次项目建设的总体架构如下图:

8c1f54f01fc22ce90830356d6d73a3a5.jpeg

功能框架图:

ffe8a0dcae525d200c461fd687f10edb.jpeg

整体格局:

e0ecf1bc81ed7ff75039e0c232315084.jpeg

二.2.2 平台****架构关系

1a81d5a371fc8298f317c34b1bf6d538.jpeg

二.3 建设内容

基于区级数据平台建设方向, 覆盖聚管通用等业务维度, 包含数据采集, 数据管理与治理以及数据共享等方面的功能, 具体功能需求描述如下

二.3.1 大数据底座

搭建统一的大数据核心平台,并整合了包括大数据存储能力、算力支持以及数据分析能力在内的多种核心功能模块。该平台不仅具备处理能力和智能化管理能力,并为运维支持提供了全面保障。

构建统一多tenant架构,并对跨平台组件实施安全管控策略。通过智能监控模块提供对系统核心资源实时监控的能力,并优化用户权限配置机制。制定标准化的操作规范流程,并确保各类资源配置的一致性和规范性。提升租赁方操作规范性的同时,在功能设计上注重模块化布局与逻辑关系优化。在此基础上提出分层权限划分方案,在保证使用灵活性的同时避免出现越权访问问题。

构建统一的多租户架构,并实现Hadoop、Kubernetes以及数据中台的有机整合,从而打造一个覆盖场景化的平台生态

Ø 建设资源服务目录,实现Hadoop组件HDFS、Hive、HBase、Yarn及Kafka的接入。

建立并维护租户资源管理和实例创建机制,在区大数据中心和区委办之间实施统一调度与优化配置,并具备实时监控和评估系统;同时构建标准化的用户权限管理体系。

通过精细权限控制机制来实现对系统的细粒度权限管理;赋予系统对组件进行精细化管理和操作的能力;增强组件的安全管控水平;同时确保数据和资源能够方便地被调用和共享。

为平台运营管理提供支持;实现线上租户管理与分析;实施用量预警;为平台运营管理提供支持。

二.3.2 数据采集子系统****

为了实现全区范围内各委办单位的数据采集需求,在线以及非实时等不同场景下提供相应的数据收集服务

采用离线、准实时以及实时三种形式的数据获取方式

结合各委办单位业务数据的特点来完成相关技术方案的设计

数据采集:政府部门提供的信息源丰富多样,在获取过程中涵盖了视频型、物联网感知型以及传统政务公共型四种主要类型的数据,并因各来源之间存在明显的格式差异而在整合阶段需进行统一规范处理以确保其可管理性。

大数据存储:满足各类业务系统对海量各类型数据进行处理的需求,并强制该平台必须采用分布式文件系统架构以处理来自全市范围内的图片和视频等内容。

数据处理的速度与精度是实现业务快速响应与高效运作的关键要素。该平台整合了分布式计算、流处理技术以及内存优化引擎等多种数据处理工具,根据不同业务场景灵活配置相应的分析模型和处理策略,在满足时效需求的同时显著提升了资源利用率和系统响应速度;通过多维度的数据分析技术优化决策支持功能,在提升政府部门在决策时效性和资源利用方面的整体水平上取得了显著成效

基于Hadoop 2.0的统一资源管理系统:该系统作为一个通用的资源管理模块,在分布式环境下支持多种应用程序实现高效的任务管理和作业调度功能。

大数据集群运维管理:以运维功能为核心,在数据基础支撑子平台之上实现高可用性、安全性以及容错能力的集群管理服务。该系统能够处理大规模集群的安装/升级/补丁操作,并通过优化配置实现高效的配置管理和智能的资源调度;同时具备实时监控与告警响应能力,并提供完善的用户与租户管理制度以确保系统的稳定运行

二.3.3 数据治理子系统

搭建大数据治理子平台系统,在标准化数据管理制度、元数据规范化流程以及质量评估体系功能等方面具备完整的技术架构设计能力的基础上实现了采集到的数据进行规范化处理;通过生产性数据中心建设和完善的数据预处理机制,在清洗和预处理后生成高质量的数据仓库资源以满足各业务部门提供支持性数据分析服务的需求。
在本次项目实施过程中, 具体而言, 在本项目中构建的大数据分析子系统包含以下几项核心功能: 数据来源接入与整合模块, 数据清洗与特征工程模块, 数据建模与分析模块以及结果可视化输出模块等。

支持资源的全生命周期管理功能体系

实现数据标准化管理

元数据管理:支持多种功能模块涵盖前向采集流程、持续更新机制、实时查询功能以及文件导入/导出接口,并包含血缘关系分析模块;

数据质量管理:该系统包含数据质量管理相关功能模块;包括质量模型配置设置、质量规则管理设置、方案配置调度设置、质检结果查看设置以及质检分析报告生成设置;

数据开发平台:支持数据开发平台能力的实现,并提供两种不同的开发模式——包括可视化的编排方式和基于原生态系统的独立构建方法;该平台能够动态地将原生开发模式与可视化编排功能进行相互转换以满足不同用户的需求;

整体资源协调系统:具备整体资源协调功能,并包含以下功能模块:流程规划与优化系统、作业调度策略监控与优化中心、任务分配与执行控制模块等

二.3.4 数据资源中心****

在本次项目实施过程中, 我们将按照既定规划, 制定全区公共数据汇聚的标准规范与管理制度, 并收集各区政府机构的公共数据, 从而建设XX市的数据资源存储平台. 在对原始数据进行清洗、转换、融合以及规范化治理的过程中, 我们将筛选并整合优质 public data 资源, 最终构建形成杨浦区 standardized data center.

基于全区构建的数据资源湖,在经过系统性治理后的高质量数据基础上,能够实现跨领域间业务流程所需的数据共享与应用需求对接。我们不仅会面向政府部门及社会各界开放获取相关资源,并且将重点推进杨浦区大数据应用的深化探索。在这一过程中,我们将围绕跨部门协作、跨领域协同以及跨行业融合的数据应用需求,在核心数据实体上展开关联分析、智能融合以及计算延伸,并提取关键算法标签并构建分类标签库。逐步构建覆盖不同领域且面向全区多部门协同的统一化服务系统,在本次项目中将建设包含以下内容的数据资源门户

在本次项目中所建设的内容包括:
1) 数据资产基础信息平台;
2) 核心业务知识图谱平台;
3) 数字 twin 中心

建设XX市级数据存储与计算平台:搭建全区公共数据的统一存储和计算基础,为各类数据资源提供了统一的汇聚存储、集中处理计算以及便捷的查询应用支持,并据此实现了基于部门类型和数据来源区分的数据隔离管理机制。

推进数据对接工作:推进与区各委办业务管理系统、XX大数据资源平台以及物联网相关平台的数据对接工作,并整合各类业务数据以构建全区公共数据资源集合

搭建基础数据平台:搭建全区统一的人口信息综合数据库、法人主体数据库、电子证照共享平台以及地理信息系统,并为全区人口信息、法人主体信息、电子证照资源以及地理信息系统等数据资源应用系统提供支撑构建。

搭建全区统一的产业经济主题数据库和电子证照数据库,并整合权力事项服务系统;为全区产业经济发展提供数据基础支持,并涵盖企业经营信息、身份信息、交易记录等关键领域。

Ø 主题库

基于跨部门、跨领域及跨行业的通用应用场景,在大数据技术的支持下,
通过实现数据关联、融合以及衍生计算操作,
系统能够自动生成相应的算法标签信息,
输出超级应用级别的数据分析服务。
主题库的构建旨在响应特定大型领域内的业务协同共享需求,
在大数据主管部门的支持下,
建立一套统一的数据资源平台,
整合各 participating entities 的共享资源,
形成互惠互利的合作机制,
实现区域内资源的有效整合与优化配置。

针对当前全区面向企业法人服务存在基础数据不足的问题,在本次项目中计划构建XX市企业精准服务主题库

Ø 专题库

为特定领域提供专题数据的应用性服务。通常由各委办局负责自行开发此类系统;此外,在实际需求基础上也可委托大数据中心进行相关建设与运营支持。这些系统主要服务于本领域的内部需求,在大多数情况下不用于支撑大型跨领域、跨行业超级综合应用或对外提供数据服务。

二.3.5 数据共享子系统****

为了降低不同委办大数据服务中共性模块的重复化程度,在确保对外服务能力的同时实现了规范化管理与快速复制成功案例的能力,并最大限度地激发外部开发潜力。通过构建覆盖广泛的大数据对外服务平台,在保障数据安全的前提下提供了基础性的数据交互功能(包括但不限于数据交换管理)、自助式的数据探索工具以及个性化的推荐系统等核心组件。这些举措充分考虑到了各行业特征的需求特点,并通过整合现有资源实现了对资源的有效整合与快速响应。

建设数据共享服务旨在构建功能与接口,在应用需求导向下,在政务服务、市场监管、城市管理以及社会治理等领域开展相关研究工作, 以促进跨区域协同发展, 构建基础数据平台

涵盖数据交互与服务管理的方面,该系统提供包括结构化的库表下放、文件传输、API接口互操作性支持、非结构化的数据传输支持以及接口转发机制等多种形式的数据交互功能。

二.3.6 门户子系统****

基于XX市大数据资源平台项目的框架上进行功能扩展。主要包含消息推送功能、数据传输功能以及个人隐私保护措施等。

搭建数据开放门户旨在整合与完善各项门户目录构建工作:涵盖数据目录体系化管理与服务保障;通过构建统一的数据接口规范与API治理机制;打造标准化的数据应用开发平台与生态体系;实施系统性地构建统一的数据图谱知识库与可视化展现平台;制定完善地图数据接入与分发服务标准;建立互动交流便捷的数据交流平台与共享机制;形成完整的 数据开发者生态链 与激励约束机制;提供个性化的辅助事项服务与精准化个人管理功能;同时具备完整的业务流程申请系统化支持以及展示反馈智能化服务功能

包含业务流程申请、展示、统计、查询等功能。

Ø 分析、统计、展示功能

通过统计分析评估数据共享与归集情况,并将其展示出来。可在填报和统计分析阶段设置审批岗位,在确保数据双重把关的基础上完成结果推送。通过实时监控KPI指标及预警信息,并及时推送;利用数据分析工具进行多维度钻取;实现从粗粒度到细粒度的切换,并生成相应的可视化图表以方便信息获取。

Ø 查询及业务流程申请功能

当委托方向大数据中心提交查询申请时,在获得相关部门的审批之后,需实现数据资源共享。经过审核后,只有获得批准的企业方才能提供数据分析服务。这些服务旨在满足某些特定的数据类型的需求。

大数据中心与委办之间实现了管理流程的对接。当委办提出需求时需先查询特定的数据项,并将通过该门户网站提交申请请求。具体而言,在涉及三清单一目录的申请时,则无需额外操作即可完成登记

二.3.7 统一运维子系统****

为了优化杨浦大数据资源平台的运营效率与维护工作, 建立标准化的监控管理体系, 并实时采集云资源、应用及业务相关的性能参数. 通过持续的数据分析, 实现对系统状态的有效监督与异常事件的快速响应. 全面评估运营效率与资源利用率的同时, 深入研究运维过程中的关键指标, 以确保大数据平台的整体稳定性与高性能运转. 同时, 构建统一的数据信息目录体系, 搭建统一的数据资产可视化平台, 实现对企业全生命周期内产生的各类数据进行全方位监管.

二.3.8 数据安全管理子系统****

构建完善的平台安全管理体系,在流量监控、防火墙装置以及内容审计等手段的基础上实施全方位的安全防护措施。确保数据传输过程中的可靠性、安全性以及高效性,并支持事件行为的可追溯功能。

通过最大化利用各组件自带的安全能力,并在量身定制标准化方案后与各组件深度整合优化以实现全面的安全能力提升工作。其中包含涵盖身份认证与权限管理统一配置、进行敏感数据识别与定位的一体化流程以及提供统一的数据脱敏处理服务;同时实现数据加密存储及秘钥管理的一体化处理;并建立实时监控用户行为及评估数据安全态势的能力框架;最终达到满足《网络安全等级保护基本要求》(GB/T 22239-2019)、《数据安全能力成熟度模型》以及《政务信息共享数据安全技术要求》(送审稿)等相关合规标准的目的

二.4 应用系统****

二.4.1 大数据底座****

大数据底座的整体技术架构如图1所示, 其中包含大数据核心平台. 集群行为分析系统. 集群管理与运营平台. 数据流处理引擎以及关联数据检索引擎等几个组成部分

大数据基础平台(DP)构建统一的资源配置机制,并负责应用运维及提供规范化的资源配置产品与服务体系。

该技术通过深入分析大数据集群资源、性能及安全等关键指标的数据特征与内在规律性关系,在此基础上制定相应的智能规划方案。支持其合理部署并持续优化运行状态,在提升整体系统效能的同时实现最大化地实现资源利用率。

资源管理与运营平台(CM)基于多租户的核心架构设计,在企业级的大数据集群环境下提供资源调度与配置优化支持。

流处理引擎(SP)负责执行统一的实时数据接入、分析和处理、分发并订阅的任务,并全面保障实时业务场景开发

关联检索引擎(SP)构建全面的知识库,并配备多样的功能模块。该系统能够针对不同类型的结构化数据进行高效解析,并向各类用户提供便捷服务。同时满足多种应用场景的需求。

资源来自互联网, 目的在于供人参考学习. 如若发现侵权内容, 请及时告知并删除相关内容. 如你喜欢这篇文章, 则可收藏关注并转发分享至其他平台.

全部评论 (0)

还没有任何评论哟~