Advertisement

A Verifiable Privacy-Preserving Federated Learning Framework Against Collusion Attacks 联邦学习文献阅读

阅读量:

系列文章目录

提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加


提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 文章目录
    • 概述

    • 简介

    • 隐私保护措施

    • DP(详细说明)

      • SMPC(详细说明)
      • 同态加密(详细说明)
      • 联邦学习中可验证性的挑战(详细说明)
    • 加密函数

    • 系统模型

    • 具体算法

      • 本地训练

概括

提示:这里可以添加本文要记录的大概内容:

当前广泛采用以保护用户隐私的数据分析技术大多容易遭受协同攻击的影响;同时这些系统中缺乏参与者自我验证机制来加强参数服务器上的数据整合过程;这将可能导致用户的敏感信息可能被非法获取以及训练出的数据准确性受到影响。

针对这些问题, 我们开发出了一个抗共谋攻击的可验证隐私保护联邦学习框架. 为了应对这些挑战, 我们基于ElGamal加密算法对联合学习方案进行了优化配置. 在某些参与者与服务器之间存在勾结的情况下, 我们的算法成功地保障了参与者的数据隐私.

此外,在引入辅助服务器后,则可使得非合谋型参数服务器与辅助服务器之间的梯度密文得以共同解密,并且能有效地抵御数据上传过程中的单一节点参数服务器模型内部可能存在的攻击行为。在该方案中,则设计了一种验证机制用于参与者确认参数聚合结果的数据完整性与准确性无误后再接受其返回信息从而避免出现因聚合结果不准确而导致的数据泄露风险。通过实验评估与性能分析表明所提出的方案不仅提升了系统的安全性而且维持了良好地训练精度并显著优于现有诸多方案的安全性和准确性


提示:以下是本篇文章正文内容,下面案例可供参考

介绍

大量 数据在促进深度学习训练与预测过程中发挥着不可替代的作用;然而 它们也带来了隐私方面的挑战。第一 参与者提供的隐私 数据可能会无意中泄露与个人相关的机密 但这种风险往往被忽视或低估;此外 当用户将这些敏感信息上传至服务器时 数据所有者往往缺乏对这些私人物件使用的充分意识与控制能力;相反 在某些行业如医疗机构 由于受到严格限制 盏方无法自由地分享敏感信息 如患者的医疗记录等。(数据孤岛和隐私问题)

因此,在医疗机构若旨在构建高精度医疗诊断模型的同时,并需遵守法律规定只能访问非敏感数据的情况下,则受限于其可用的数据量有限而难以训练出高精度的深度学习模型

因此,在保护参与者隐私的前提下,在不信任的关系中实现协作学习,并避免了各参与方私有数据集的泄露或暴露。通过这一方法论设计,在不信任的关系中实现协作学习的同时实现了目标模型的共同优化。

首先 每个参与者分别利用本地数据集独立训练模型 从而产生梯度向量 随后这些梯度向量会被上传至参数服务器用于汇总 在完成汇总流程后 每个参与者会从参数服务器获取汇总后的梯度向量 并用于更新各自本地的深度学习模型 这一迭代流程会持续进行 直到获得更为精确的模型 尽管联邦学习通过防止攻击者直接访问私有数据来提供保护 但Phong等人的研究表明 即使仅分享梯度信息 手端仍可逆推出参与者的某些隐私信息 然而Ma等人开发了一种基于ElGamal同态加密算法的多方深度学习方案 尽管该方案有效地保护了参与者的私人信息机密 但它确实存在一定的安全限制 首先 在生成同态加密密钥时需要参数服务器与各参与者的协作 因此若参数服务器与某些参与者串通一气 密钥的安全性将受到威胁 从而导致参与者的敏感数据可能被泄露 其次 参与者在完成密钥生成及联合解密的过程中会对自身带来较大的计算负担

为了解决这一问题, 本研究提出了一种新型联邦学习方案, 特别注重隐私保护措施. 该方案通过多种机制确保参与者不受合谋攻击影响, 并且既保证了数据聚合结果的准确性与完整性, 又能有效防止同态加密密钥泄露, 同时降低了参与者的通信成本.

本文的核心贡献体现在:首先开发出一种新型可验证隐私保护联邦学习架构;其次该架构基于ElGamal同态加密算法实现了对参与者敏感数据的安全处理;最后通过机制设计成功抵御了潜在共谋攻击。

我们部署一个辅助服务器作为防止 server 和参与者串通一气攻击的策略。参数 server 与辅助 server 可联合解密 ElGamal 加密方案加密的梯度明文。此外,在减少参与者数量的同时也降低了与参与者相关的通信开销。

开发了一种可靠性验证机制,并利用双线性聚合签名来确保参与者能够可靠地验证数据完整性与准确性.这种机制有效地区分并阻止了有意的行为干扰真实数据的获取.

基于真实数据集对该方案进行了系统的实验评估。实验结果显示该方案具有良好的安全性能、高效执行能力和较高的准确性

隐私保护方法

主题:隐私保护深度学习方法分类
内容:

两类主要方法:
数据扰动方案:如差分隐私理论(Differential Privacy Theory)所指出的那样。
基于现代密码学技术的方法:
涵盖同态加密技术(Homomorphic Encryption Techniques)和安全多方计算协议(Secure Multiparty Computation Protocols)。
挑战:
在隐私保护的前提下,
进一步探讨了可验证性特征以及串通攻击的影响因素(Impact Factors)。

DP

Shokri 等人开发出一种新型的噪声梯度共享系统(采用在梯度上加入扰动生成该系统的Privacy Protection Mechanism)。Phan 等人优化了Differential Privacy中的Noise Injection Mechanism,并根据各特征的重要性动态调节所需的噪音量(无需依赖固定的训练阶段数量)。Miran 等研究者将Homomorphic Encryption技术与Differential Privacy相结合应用于逻辑回归模型中,并成功实现了模型的安全性和有效性。Gong 等团队开发出一种动态 Privacy Budget分配方案,在各个训练周期中根据实时数据分布自动优化保护力度,并显著提升了整体系统的安全性。

SMPC

Mohassel等人提出了安全两方计算协议,并涵盖线性回归、逻辑回归等多种任务。Bansal等人利用秘密共享与安全标量实现了两方协议的高效运行。然而,在参与者人数增多时, 该方案的效率逐渐下降。Bonawitz等人提出了一种安全数据聚合方法, 并使各方能够撤销参与, 然而, 在这种方法中存在一定的通信开销问题

同态加密

主题:同态加密(Homomorphic Encryption)的应用与局限性
内容:

Phong等利用Paillier和LWE密码系统提出了一种隐私保护方案,在使用统一密钥时存在恶意参与者窃取数据的风险。

可验证性在联邦学习中的挑战

在这里插入图片描述
在这里插入图片描述

数据完整性:通过机制保证聚合结果与训练过程的真实可靠。
协同攻击:通过技术手段防止参与者通过合谋破坏系统或侵犯隐私。
研究面临的主要挑战在于:
现有方案通常面临较高的通信与计算开销问题。
目前鲜有解决方案能够同时兼顾数据完整性与协同防御机制。
研究者们最终的目标是在隐私保护、数据完整性以及协同防御能力之间找到平衡点,并尽可能降低相关的计算与通信成本。


加密函数

提示:这里对文章进行总结:

例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
在这里插入图片描述
在这里插入图片描述

系统模型

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

具体算法

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本地训练

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

系统初始化阶段,在初始化阶段中,参数服务器与辅助服务器负责生成关键参数集合。基于ElGamal加法器与Diffie-Hellman协商机制的协作下共同协商出联合公钥PK,并向下分配给所有参与者。

  1. 密钥生成阶段
    各参与方各自创建独立的公私钥对。
    参数服务器与协助服务器共同创建各自的公私钥,并协同完成全局联合密钥的构建。

  2. 本地训练环节 各参与方基于本地数据集开展模型训练,并计算出对应的梯度向量Δw。各参与方对计算出的梯度向量Δw分别进行加密处理并附加签名信息后,在完成上述操作后将处理后的梯度信息提交至参数服务器用于全局模型更新

  3. 梯度聚合阶段
    参数服务器通过基于同态加密机制的加法特性来整合各参与方计算所得的加法型密钥梯度向量。最终汇总得到完整的加法型密钥总和 Δ W 。(数学公式 ... 原样保留)

  4. 密文转换阶段
    参数服务器对聚合的密文实施盲化处理,并将其传递给助理 server。
    助理 server 解密中间结果后,并利用各参与方的公钥重新加密该结果,随后返回给参数 server。
    通过最终级别的盲化处理,参数 server 进一步保护信息安全,并防止 assistant server 从中间结果中获取敏感信息。

  5. 参数更新阶段
    参与方接收处理后的密文并调用私钥解密功能获取总梯度值。
    通过数字签名验证机制确保计算结果的真实性与完整性。
    验证无误后完成模型参数更新操作。
    优势分析
    采用ElGamal加密方案与联合公钥体系保障数据隐私性特征,在防止信息泄露方面具有显著优势。
    基于多方加密机制设计能够有效抵御恶意行为带来的潜在威胁,在抗干扰能力上有明显提升。
    引入数字签名验证流程可有效识别异常操作行为并及时纠正错误信息来源,在系统可靠性方面表现突出。
    创新性体现在异步运算框架构建上实现了加法同态运算功能集在线部署,在提高效率的同时降低了资源消耗成本。

全部评论 (0)

还没有任何评论哟~