Advertisement

【洞见观点】金融领域隐私计算平台间的互联互通技术实践与研究

阅读量:

目录

互联互通的定义

互联互通的原则

互联互通演进史

第一阶段:业务驱动不同厂商的隐私计算平台一对一对接

第二阶段:厂商自定义自己的互通规范

第三阶段:形成行业统一的标准规范

互联互通的实现路径

第一层次:管理系统互通

1)节点发现

2)资源管理

第二层次:算法协议互通

1)核心算法的设计原理不同

2)支撑算法运行的功能组件的差异化

第三层次:计算原语互通

互联互通的展望


背景介绍: 随着隐私计算技术的发展,越来越多的技术服务厂商研发了自己的隐私计算平台,或服务于自有生态,或服务于金融机构,或服务于政府机构,将原本独立存在的数据孤岛连接了起来,实现了“数据的可用而不可见”。但是因为不同的隐私计算平台基于自有知识产权的算法原理和系统设计实现,且目前闭源的平台居多,平台之间原生无法完成信息的交互,将“数据孤岛”变成了“数据群岛”。以金融机构为例,作为数据的应用机构,往往面对着和不同的数据提供机构合作时,需要部署不同隐私计算平台的情况,存在着严重的系统建设和运营成本浪费,因此“互联互通”成为了隐私计算在金融领域应用正在面临的新挑战。

为了应对金融领域隐私计算平台间的互通性挑战,北京金融科技产业联盟*与中国信通院**等标准化组织正致力于构建互联互通的技术标准,本文将从技术层面深入探讨金融领域隐私计算跨平台互联互通的发展轨迹及其未来趋势

互联互通的定义

隐私计算常用技术方案 包括:联邦学习作为核心机制之一,在数据隐私保护方面具有重要地位;安全多方计算则通过多参与方协作完成数据处理任务;可信执行环境则通过物理隔离保障数据安全性;同态加密则提供了数据在加密状态下的运算能力。在不同技术方案间存在技术和应用场景上的差异,在实现互联互通的技术难度较高。业内普遍认为“互联互通”通常指同一类技术方案间的协同运作机制。

隐私计算平台间的互联互通指的是基于不同设计原理和功能实现的隐私计算平台之间协同完成某一项隐私计算任务的能力。具体而言是指各平台间通过统一规范的数据交互接口、算法协议以及标准化的操作流程等实现数据资源与计算能力的有效交互与协同合作机制,在解决各平台间的数据提供方与数据应用方之间的协作问题的同时,促进资源与价值在多个平台间的共享与互惠。

互联互通的原则

隐私计算跨平台互联互通遵循共同点与差异点的原则

就其互联互通的基础环节达成一致意见,并据此制定统一的技术规范标准。

针对具体的算法实施及各类平台的个性化服务功能进行差异化的开发方案设计,并允许灵活配置以适应不同的业务需求

互联互通演进史

在隐私计算技术不断进步的过程中,在线性代数的基础上构建的数据处理体系经历了三个主要的发展阶段

第一阶段:业务驱动不同厂商的隐私计算平台一对一对接

当前已有或已在研发自己隐私计算平台的大型机构会要求利用其数据的客户部署并使用该平台。

大型的数据应用机构(例如银行、保险等金融机构)无法仅凭对接一份外部数据就建立起一套由对方提供的平台系统;就其在机构内部的业务流程及操作流程而言,这是一项相当繁重的工作量,在实际操作中往往难以实现并最终难以落地

此外,例如: 银行总行和不同的省分机构、业务中心各自部署了不同隐私计算厂商的平台,在银行内部的信息共享也面临着互联互通的需求

在这种情况下,在此时刻主要针对特定业务领域各相关方进行一对一的技术对接沟通。这一过程具有良好的兼容性和适应性,并需确保节点管理和资源管理的一致性与协调性;同时还需要考虑所采用算法的具体流程设计。

在业务导向的前提下

第二阶段:厂商自定义自己的互通规范

随着业务规模的发展,在服务金融客户的过程中, 各相关方逐渐出现更多互联需求, 在第一阶段的实际落地后, 各方需制定本方的互联规范, 包括具体采用通信协议、报文打包方式以及加密方法, 并明确算法的具体实现流程, 最终形成一份完整的互联互通文档. 这些文档中还应包含若干实用的技术参考工具包. 然而, 由于厂商自主声明的技术规范难以形成统一行业标准与操作指南, 实现互联互通还需依靠双方商业合作的动力以及彼此积极协作才能完成

第三阶段:形成行业统一的标准规范

目前该隐私计算平台正处于互联互通的第三个发展阶段。各参与方已构建起各自的数据孤岛状态,并因缺乏直接的数据互通机制而形成分散的数据孤岛分布格局。尽管各方均致力于构建统一的数据互联互通平台以促进数据共享与协作效率提升,在相互协作的过程中不断拓展着彼此构建的数据生态网络,在零散的数据孤岛之间架起了多座数据互通桥梁以促进资源的有效整合与共享效率的最大化。

图片

图1:数据孤岛-数据群岛-重复互联

数据群岛 的形成不仅源于经济驱动因素, 还由于技术发展的影响. 每个群岛都具有独特的生态系统, 并且专门设计了针对自身生态系统所需的算法和工程优化配置. 这种配置是合乎逻辑的.

然而互联互通从根本上说 ,它是一个系统对接的过程。其中可能涉及一些技术上的巧妙设计,但其核心目标是‘通’。因此需要制定一个统一的标准指引以便大家能够参考实现。

当前的金融行业标准制定工作由北京金融科技产业联盟负责推进中,在推动金融行业系列标准的制定与完善的同时, 该组织也致力于引导隐私计算行业的健康发展

明确的标准将有助于建立清晰的技术框架。例如通信协议和报文格式等基本要素,在缺乏这些明确标准的情况下(例如),若未能建立统一的技术规范,则各系统间的互通将难以实现。为了使这一目标得以实现(即推动行业健康发展),这项工作值得投入资源进行推进。(注释部分未被包含在最终输出中)

既追求统一性又不失个性

互联互通的实现路径

从整体至局部的技术架构框架出发,在基础到前沿的技术落地路径下

图片

图2:互联互通实现层次

第一层次:管理系统互通

管理系统互通意味着多套互操作性较高的隐私计算平台能够在应用层面实现业务间的互联与协作机制建设,在节点发现和资源管理等方面展开工作。最终目标是实现不同系统间业务层的互联互通和信息共享。

1)节点发现

通过基于预先确定的协议(predefined agreement)来实现各平台间角色识别,并在此基础上构建起各平台之间的网络连接关系;随后通过身份验证机制(identity verification mechanism)来确认彼此的身份信息;最后基于此基础实现机构间合作关系的确立与终止等完整的业务流程。

2)资源管理

各隐私计算平台基于统一资源管理接口进行对接与规划,在金融领域对数据资源实施命名空间的统一规范与标识以确保数据的独特性,并在此基础上完成计算任务所需的输入数据标准化处理。

各隐私计算平台均遵循各自算法原理及系统设计方案进行开发。由于各平台之间 inherent 无法进行数据交互,因此必须先制定各隐私计算平台间的通信协议,在这一基础上明确报文格式、参数内容等要素均需明确,方能完成后续消息传递与协作指令处理等相关流程。

第二层次:算法协议互通

不同的隐私计算平台之间的差异主要在两个部分:

1)核心算法的设计原理不同

隐私计算技术服务厂商的核心知识产权是其核心技术的关键内容。每种算法的设计决定了数据运算的逻辑以及数据传输的过程;正是因为各类型算法的设计原理存在差异性,在现有的技术框架下难以实现不同平台间的兼容性。

2)支撑算法运行的功能组件的差异化

包括通信模块、加密组件、资源管理、任务管理、模型管理、节点管理、授权管理等在内的诸多功能组件均是不同的技术服务厂商基于各自的技术积累和应用场景而实现 ,呈现出显著的差异性。

基于"互联互通"这一整体架构的设计理念下

a. 基于统一通信协议的方式进行 :通过HTTPS协议实现隐私计算信力消息同步,并采用GRPCS技术完成数据交互过程;

b. 基于统一的安全组件设计:通过预先定义的标准强度加密算法实现;同时遵循安全标准生成高质量的随机数。

基于统一名称空间的一致性标识:遵循统一命名空间规则对各个数据集间的元数据进行关联操作,并确保实现全局唯一的标识符

d. 基于统一任务调度机制 :构建标准化的任务管理接口,在隐私计算系统中实现任务从启动到终止的全流程管理;

**e. 规范化的模型封装方案 :**规范算法的封装方案,在各个隐私计算平台间实现无缝迁移,并广泛应用于批量预测任务以及在线推理服务中;

f. 统一管理网络节点 :制定标准化的节点 discovery 协议以及身份认证机制(包括但不限于认证证书、签名证书等);

g. 建立统一的资源管理框架:构建标准化的资源申请流程体系,并对操作权限类型、审批层级及审批时限等关键参数进行明确规定

当功能组件实现了标准化规范后** ,各个隐私计算平台能够集成多样化的‘算法插件’以构建统一的功能外延架构。

图片

图3:统一外部功能框架

关于“核心算法”的统一,存在两种方式

针对某一特定算法,在技术服务领域内可遵循现有学术研究制定统一的技术规范。即此特定算法的设计应具备公开透明性特性,在不同厂商之间可各自采用适合的技术栈完成计算逻辑与交互流程设计,并最终实现各隐私计算平台间的互联互通。

图片

图4:各参与方自研标准算法插件完成互通

其类似地将其视为预先标准化的功能组件将其视为一个不可知的模块不对其内部设计进行规定而是对其基本要素输入与输出进行明确的规定:

a. 算法概述:该方法通过明确的步骤实现自动化操作流程设计;该系统采用了标准化的技术规范文档作为基础依据;系统各环节的操作人员均需明确其职责范围及执行标准;系统运行参数设置采用统一的标准模板确保一致性

算法输入

c. 算法输出

在完成算法周边信息定义后, 算法可通过"算法插件"的形式由不同技术服务提供商发布, 在满足安全认证及授权条件的基础上, 整合到另一方的隐私计算平台, 实现同构化后的算法插件间的互联互通.

图片

图5:一方自研算法组件部署到另一方完成互通

第三层次:计算原语互通

在隐私计算领域中,各平台采用的算法或协议实现路径各有差异。例如,在安全多方计算平台上,采用的技术包括秘密共享协议、无 notice 传输以及混淆电路等多种途径;而联邦学习平台则在算法拆分与具体实施细节上存在显著差异,在其主要采用的是同态加密技术与多种多方计算策略的不同应用模式下

但是所有隐私计算技术实现方案能够对所涉及的算法或协议进行最小粒度的计算原语分解,在安全多方计算中采用ABY3秘密分享协议的情形下,则需要参与者按照该协议设计原则下的数据处理流程完成原始数据的安全拆解,并基于密文空间下完成加密运算的具体实施步骤。

基于协议机制,在各个步骤中完成对特定数据实体的数据加密与解密操作;针对不同隐私保护需求,在其对应的环境中完成对特定数据实体的实际化处理;通过各层次间的互联互通机制,在数据加密与解密层面建立统一的数据处理框架;并在此框架下逐步完善底层数据处理算法、上层业务服务接口及其相应的安全防护体系。

互联互通的展望

在《隐私计算行业互通系列标准》正式发布实施后,其技术对接机制将加速推动各类隐私计算平台的发展与创新,特别是在助力金融机构实现数字化转型进程中,能够有效解决当前面临的技术难题。此外,这一对接也将通过优化资源配置结构以提升整体效率,进一步强化 participating机构的风险管理能力,从而在多个维度上促进金融业务实现高质量发展。同时,这一进程将有助于推动数据驱动型经济模式的发展及相关商业模式创新,鼓励更多场景中对数据进行开放获取与广泛应用,最终完成金融科技领域的系统性升级

全部评论 (0)

还没有任何评论哟~