【论文阅读】Poison Forensics: Traceback of Data Poisoning Attacks in Neural Networks

阅读量：

Poison Forensics: Retracing Data Poisoning Attacks in Neural Networks

核心原理
前提条件
方法
- 第一个问题
- 第二个问题

核心原理

有毒样本会导致模型在参数空间中趋近于最佳位置，而良性样本会导致该模型向其随机初始化状态转移。

前提条件

最重要的：

可以获取错误分类对 $(x_a, y_a)$ , 其中 $y_a$ 即为目标标签。
系统已经被用户部署完成，则其余部分的基本思路与一般性的后门防御方法一致。

方法

依次从训练集中剔除纯净的样本，并如前所述，在去除一部分被认为是纯净且可能影响模型表现的数据集 $D_1$ 后，在测试点 $(x_a, y_a)$ 上模型 $F^-$ 表现出更高的置信度（即损失值降低）。研究的核心在于通过聚类方法识别并剔除这些被认为是纯净但可能影响模型表现的数据点。

到目前为止引入了两个问题：

如何确定 $D_1$ ？我们可以利用聚类分析方法来找寻它。
将x进行表征后再进行聚类分析会更加有效。
如何推导出 $F^-$ ？这个过程涉及到不断移除干净样本以生成多个版本的参数空间。
直接进行训练会导致计算成本显著增加吗？这是因为持续清除干净样本的过程会产生多个版本的模型参数集合。

第一个问题

通过评估训练样本 $x$ 对最终模型参数的作用来实现数据映射。这种做法是基于对比完整训练数据集 $D$ 和移除 $x$ 后的数据集 $D \verb|\| x$ 上获得的结果来进行的

移除良性数据或有毒数据对模型参数的影响程度是不同的。在移除有毒样本的情况下，模型的参数会朝向一个最优位置收敛，在该位置毒性攻击不再有效；当仅移除良性样本时，则会导致模型参数趋向于初始状态。

一种较为简便的实现途径是对 $D \verb|\| x$ 进行再训练过程，这将导致不必要的计算开销以及训练过程中的随机性问题。

相反地，在借鉴了"遗忘"这一概念的基础上,我们提出了基于梯度计算的方法来估算参数的变化率。当给定一个确定的损失函数时,在模型中存在某个数据点对应其梯度的情况时,我们能够明确地识别出该数据点对该模型的整体影响机制。

从直观上看

第二个问题

设计了一个unleaning的方式得到 $F^-$ ，可以减小开销：

在等概率的情况下，在若分为三项时，则NULL表示为[1/3, 1/3, 1/3]；依据获得F和F⁻后就不再受限于公式（1）了。

全部评论 (0)

还没有任何评论哟~

【论文阅读】Poison Forensics: Traceback of Data Poisoning Attacks in Neural Networks

PoisonForensics:TracebackofDataPoisoningAttacksinNeuralNetworks 核心原理前提条件方法第一个问题第二个问题核心原理有毒样本会使...

Poison Frogs! Targeted Clean-Label Poisoning Attacks on Neural Networks 论文阅读、复现及思考

文章目录论文简介攻击方法论文实验实验复现及可行性探索迁移学习数据集与超参数复现实验实验结果分析与讨论进一步探索类内、类间featuremaps featuremap是否对距离敏感 ...

【论文笔记】Poison Frogs! Targeted Clean-Label Poisoning Attacks on Neural Networks

PoisonFrogs!TargetedCleanLabelPoisoningAttacksonNeuralNetworks 引言创新性本篇论文的贡献（目的）算法步骤实验结果引言本文中关于...

[论文阅读2]Influence Function based Data Poisoning Attacks to Top-NRecommender Systems

摘要：推荐系统是web服务的重要组成部分。流行的推荐系统使用大量的众包用户项目交互数据对用户偏好和项目属性进行建模，例如，评分分数；然后向用户推荐与用户偏好最匹配的n顶级项目。

MUNN：Mutation Analysis of neural networks论文阅读

时间：20180912 数据集：MNIST 首先，该文章针对的是神经网络的测试问题，其目的，我认为一是得到覆盖率高的测试集，即（testadequacy）二是，由于mutationanalysis...

【论文阅读】Model Stealing Attacks Against Inductive Graph Neural Networks（2021）

摘要 Manyrealworlddata（真实世界的数据）comeintheformofgraphs（以图片的形式）.GraphneuralnetworksGNNs图神经网络,anewfamilyof...

论文--阅读翻译笔记-Reducing the Dimensionality of Data with Neural Networks

摘要：通过训练小中间层（smallcentrallayer）的多层神经网络（神经元个数小于维数），可以将高维数据（highdimensionaldata）转换为低维编码（lowdimensional...

【论文阅读】Efficient Model-Stealing Attacks Against Inductive Graph Neural Networks（2024）

摘要 GraphNeuralNetworks（图神经网络）GNNsarerecognizedas（被认为）potenttools（有力工具）forprocessing（处理）realworlddata...

On the Spectral Bias of Neural Networks论文阅读

1\.摘要众所周知，过度参数化的深度神经网络DNNs是一种表达能力极强的函数，它甚至可以以100%的训练精度记忆随机数据。这就提出了一个问题，为什么他们不能轻易地对真实数据进行拟合呢。为了回答这个问...

【论文阅读】Model Extraction Attacks on Graph Neural Networks: Taxonomy and Realisation（2021）

摘要 Machinelearningmodels（机器学习模型）areshowntoface（面临着）aseverethreat（严重的威胁）fromModelExtractionAttacks（模型...

是否确定退出登录?

【论文阅读】Poison Forensics: Traceback of Data Poisoning Attacks in Neural Networks

Poison Forensics: Retracing Data Poisoning Attacks in Neural Networks

核心原理

前提条件

方法

第一个问题

第二个问题

全部评论 (0)

相关文章推荐

【论文阅读】Poison Forensics: Traceback of Data Poisoning Attacks in Neural Networks

Poison Frogs! Targeted Clean-Label Poisoning Attacks on Neural Networks 论文阅读、复现及思考

【论文笔记】Poison Frogs! Targeted Clean-Label Poisoning Attacks on Neural Networks

[论文阅读2]Influence Function based Data Poisoning Attacks to Top-NRecommender Systems

MUNN：Mutation Analysis of neural networks论文阅读

【论文阅读】Model Stealing Attacks Against Inductive Graph Neural Networks（2021）

论文--阅读翻译笔记-Reducing the Dimensionality of Data with Neural Networks

【论文阅读】Efficient Model-Stealing Attacks Against Inductive Graph Neural Networks（2024）

On the Spectral Bias of Neural Networks论文阅读

【论文阅读】Model Extraction Attacks on Graph Neural Networks: Taxonomy and Realisation（2021）