【论文笔记】Poison Frogs! Targeted Clean-Label Poisoning Attacks on Neural Networks

阅读量：

Poison Frogs! Targeted Clean-Label Poisoning Attacks on Neural Networks

引言
创新性
本篇论文的贡献（目的）
算法步骤
实验结果

引言

本文中关于投毒攻击的定义（文中有一些举例很帮助理解）：
对抗样本：发生在测试时，一个干净的目标实例被修改导致分类器错误分类。但是，这无法应用在攻击者无法控制测试时间数据的某些现实场景。例如，①考虑一家零售商打算通过基于 ML 的垃圾邮件过滤器将竞争对手的电子邮件标记为垃圾邮件。对抗样本攻击不适用，因为攻击者无法修改受害者的电子邮件。②对于人脸识别系统，在有人值守的安全台或建筑物入口，攻击者可能无法更改在受监督条件下运行的人脸识别引擎的输入。这样的系统仍然容易受到数据中毒攻击。

投毒攻击：发生在训练时，通过将精心构建的毒物实例插入训练数据来操纵系统的性能。本文旨在控制分类器在一个特定测试实例上的行为。例如，①操纵面部识别引擎来更改一个特定人的身份，②操纵垃圾邮件过滤器来允许/拒绝攻击者选择的特定电子邮件。

创新性

先前的攻击方法需要修改测试时实例以触发错误预测。此外，在大多数先前的工作中，假设攻击者对训练集中实例的标记过程有一定程度的控制，这并不符合应用实际。

本篇论文的贡献（目的）

攻击者①使用“clean-label”，不需要对训练数据的标记有任何控制；②制作肉眼难以区分的中毒样本，使得在含中毒样本数据集上重新训练的神经网络将一个类（例如，恶意软件）中的特殊测试实例错误分类为她选择的另一类（例如良性应用程序）实例。③在不降低整体分类器性能的情况下控制分类器在特定测试实例上的行为，实现针对性攻击。

算法步骤

1.假设攻击者了解模型及其参数，攻击者首先从测试集中选择一个target instance(t),成功的中毒攻击会导致此目标示例在测试期间被错误分类。接下来，攻击者从base class中采样一个base instance(b)，并对其进行难以察觉的更改以制造毒实例poison instance§；这种毒药被注入到训练数据中，目的是欺骗模型在测试时用基本标签标记目标实例。最后，模型在中毒数据集（干净数据集 + 中毒实例）上进行训练。如果在测试时模型将目标实例误认为在基类中，则认为中毒攻击是成功的。
2.优化目标
在这里插入图片描述
前一项，让中毒示例与目标示例在神经网络中提取出的特征尽可能相似；后一项让中毒示例在外观上与基类示例看上去尽可能相似以此来欺骗管理员将其错误标签为基类达到“clean-label”。
3.算法流程

实验结果

1.迁移学习网络，仅训练最终网络（softmax）层
①实验数据集：ImageNet dog-vs-ﬁsh
②神经网络架构：InceptionV3
在这里插入图片描述
作图为生成的一些中毒示例，当在中毒数据集上进行训练时，目标实例会以高置信度被错误分类。使用迁移学习时，只需一张毒物图像就可以控制分类器的行为

2.end-to-end training（模型的所有层都被训练）
①实验数据集：CIFAR-100
②神经网络架构：AlexNet
在这里插入图片描述
攻击end-to-end training的模型，仅仅是用一张中毒数据是非常困难的。为了防止训练过程中毒物和目标分离，本文使用了一个简单但有效的技巧：将目标实例的低不透明度水印添加到毒物实例中，以允许一些不可分割的特征重叠，同时保持视觉上的不同。
在这里插入图片描述

全部评论 (0)

还没有任何评论哟~

【论文笔记】Poison Frogs! Targeted Clean-Label Poisoning Attacks on Neural Networks

PoisonFrogs!TargetedCleanLabelPoisoningAttacksonNeuralNetworks 引言创新性本篇论文的贡献（目的）算法步骤实验结果引言本文中关于...

Poison Frogs! Targeted Clean-Label Poisoning Attacks on Neural Networks 论文阅读、复现及思考

文章目录论文简介攻击方法论文实验实验复现及可行性探索迁移学习数据集与超参数复现实验实验结果分析与讨论进一步探索类内、类间featuremaps featuremap是否对距离敏感 ...

【论文阅读】Poison Forensics: Traceback of Data Poisoning Attacks in Neural Networks

PoisonForensics:TracebackofDataPoisoningAttacksinNeuralNetworks 核心原理前提条件方法第一个问题第二个问题核心原理有毒样本会使...

【论文笔记】Bullseye Polytope: A Scalable Clean-Label Poisoning Attack with Improved Transferability

BullseyePolytope:AScalableCleanLabelPoisoningAttackwithImprovedTransferability 创新性本篇论文的贡献（目的） Bulls...

Unnoticeable Backdoor Attacks on Graph Neural Networks总结笔记

UGBA 发表期刊：ArXiv2023 问题：图的后门攻击需要大量的攻击预算才能进行有效的后门攻击，而且注入的触发器可以很容易被检测和修剪。基本思想：通过攻击预算的约束生成触发器过程，增加后门攻击的...

【论文笔记】Patch-wise Attack for Fooling Deep Neural Network & Patch-wise++ Perturbation Targeted Attacks

【ECCV2020】PatchwiseAttackforFoolingDeepNeuralNetwork&Patchwise++新版本Patchwise++PerturbationforAdversa...

读论文：STRIP: a defence against trojan attacks on deep neural networks

个人原创，转载请标记出处。本文是阅读论文《STRIP:adefenceagainsttrojanattacksondeepneuralnetworks》后的笔记，本文的撰写将不以翻译为基准，而以内容...

KDD2018《Adversarial Attacks on Neural Networks for Graph Data》论文详解

AdversarialAttacksonNeuralNetworksforGraphData 论文链接：<https://arxiv.org/pdf/1805.07984.pdf evasionatt...

KDD2021《TDGIA: Effective Injection Attacks on Graph Neural Networks》论文详解

原文链接：https://arxiv.org/pdf/2106.06663.pdf evasionattack 1&2Abstract&Introduction 本文作者分析了图注入攻击（GraphI...

【随记】Adversarial Attacks on Neural Networks for Graph Data

目录 1、简介（含背景知识） 0、先验知识 0.1、针对于图神经网络的分类问题主要有两种，即图分类、节点分类。具体如下： 0.2、攻击方式分类 0.3、机器学习类别 2、正文一、Introducti...

是否确定退出登录?

【论文笔记】Poison Frogs! Targeted Clean-Label Poisoning Attacks on Neural Networks

Poison Frogs! Targeted Clean-Label Poisoning Attacks on Neural Networks

引言

创新性

本篇论文的贡献（目的）

算法步骤

实验结果

全部评论 (0)

相关文章推荐

【论文笔记】Poison Frogs! Targeted Clean-Label Poisoning Attacks on Neural Networks

Poison Frogs! Targeted Clean-Label Poisoning Attacks on Neural Networks 论文阅读、复现及思考

【论文阅读】Poison Forensics: Traceback of Data Poisoning Attacks in Neural Networks

【论文笔记】Bullseye Polytope: A Scalable Clean-Label Poisoning Attack with Improved Transferability

Unnoticeable Backdoor Attacks on Graph Neural Networks总结笔记

【论文笔记】Patch-wise Attack for Fooling Deep Neural Network & Patch-wise++ Perturbation Targeted Attacks

读论文：STRIP: a defence against trojan attacks on deep neural networks

KDD2018《Adversarial Attacks on Neural Networks for Graph Data》 论文详解

KDD2021《TDGIA: Effective Injection Attacks on Graph Neural Networks》论文详解

【随记】Adversarial Attacks on Neural Networks for Graph Data

KDD2018《Adversarial Attacks on Neural Networks for Graph Data》论文详解