Advertisement

SimpleNet: A Simple Network for Image Anomaly Detection and Localization CVPR2023

阅读量:

文章信息
题目:SimpleNet: 一种简洁高效的方法用于图像异常检测与定位(Proceedings of the Conference on Computer Vision and Pattern Recognition 2023)
原文:https://ieeexplore.ieee.org/document/10203746
代码:https://github.com/donaldrr/simplenet
数据集:MvTec Advanced Defects Dataset

一、简述
图像异常检测与定位技术在工业领域有着广泛的应用场景。现有的图像异常检测方法主要可分为三类:基于重构的技术(如AE-SSIM、RIAD)、基于合成的方法(如DR-EM、CutPaste)以及基于嵌入式的算法(包括CS-Flow、PaDIM、RevDist、PatchCore)。本文提出了一种名为SimpleNet的新方法,在上述三种技术的基础上进行了创新性改进。该网络体系由四个主要模块组成:预训练的特征提取模块、中间特征适配模块、异常特征提取器以及异常判别子网络。为了验证其性能优势,在MvTec AD数据集上进行实验研究,并选取了包括基于重构、合成以及嵌入式的多种基准算法作为对比对象。实验采用FPS指标和AUROC作为评估标准,在测试过程中发现SimpleNet较以往方法展现出显著的性能提升效果,并且其整体架构较为简洁明了,在实际工业场景中易于部署与应用。

二、SimpleNet模型
SimpleNet网络包含四个组件:经过预训练的特征提取模块、用于浅层特征适配的模块、用于生成异常特性的模块以及用于判断异常特性的模块。下图是SimpleNet网络模型图:

在这里插入图片描述

2.1处理过程:
(实线)在训练阶段,在线性变换下完成图像的空间域局部特性提取操作以生成基础局部空间特征求索结果;随后,在基于学习的自适应网络框架下完成对这些基础局部空间特征求索结果的自适应性特性优化计算;随后通过添加人工高斯噪声随机干扰的方式获得融合后的异常空间特征求索结果;最后将自适应优化后的空间特征求索结果与人工高斯噪声污染的空间特征求索结果共同输入到判别网络模块中完成两组异常评分分布信息的联合获取;
(虚线)在测试阶段,在主框架下接收待检测图像并完成一次完整的图像全局特性信息提取操作;随后在线性变换基础上完成对该次全局特性信息求解操作并获取基本全局特异性求解结果;最后将该次求解出来的全局特异性求解结果输入到自适应优化网络模块中计算出最终的一次全局异常评分分布信息

2.2具体构成:
2.2.1 特征提取器(feature extrator)

在这里插入图片描述

2.2.2 特征适配器(feature adaptor)

在这里插入图片描述

2.2.3异常特征生成器(anomalous feature generator)

在这里插入图片描述
在这里插入图片描述

2.2.4判别器(discriminator)

在这里插入图片描述

2.2.5 损失函数

在这里插入图片描述

2.2.6异常得分

在这里插入图片描述

三、实验及结论
3.1 实验准备
数据集:MVTec AD包含5个纹理,10个类别,共计5354张图片。有用于训练的正常图像和用于测试的含赫雷缺陷的正常和异常图像,为缺陷测试图像提高像素级标准。
评价标准:I-AUROC(图像级), P-AUROC(像素级), FPS
参数设置:实验中使用的所有骨干都使用ImageNet进行了预训练。骨干网和ResNet架构相似时,使用骨干网络的第二和第三中间层用于特征提取。使用Adam优化器,将特征适配器和鉴别器的学习率分别设置为0.0001和0.0002,并将权重衰减设置为0.00001。主干网络为WideResnet50,高斯噪声设定为0,0.015), th+=th-=0.5,epoch=160,batchsize=4

3.2 实验过程 采用SimpleNet方法(主干网络选用WideResnet50架构),将其与其他几种不同类型的现有技术方案进行对比实验:包括基于图像重建的深度学习技术(如AE-SSIM、RIAD算法),基于图像生成的对抗训练框架(如DR-EM、CutPaste模型),以及基于特征嵌入的空间分割技术(如CS-Flow、PaDIM、RevDist和PatchCore算法)。所有这些算法均在同一标准数据集——MVTec AD数据集——上进行异常检测任务的评估,并以I-AUROC值(左侧图表)和P-AUROC值(右侧图表)作为评估模型性能的主要指标。经过测试分析发现:本研究提出的方法在测试的15个类别中,在9个类别上均取得了最佳成绩;整体表现优异。具体结果请参考下表所示数据

在这里插入图片描述

3.3 消融实验
确定最优的p值:通过不同尺寸的patch进行模型性能评估,在本研究中将参数设置为patchsize = 4时(即p=4),实验结果表明I_AUROCRP_AURC_R均取得了理想的效果。当超过这一阈值(即p>4)时,在保持I_AURC_R增长的同时,P_AURC_R反而呈现下降趋势。因此最终确定最优参数设置为p=4

在这里插入图片描述

网络架构的选择

在这里插入图片描述

适配器配置方面进行了对比分析。研究结果表明,在所有配置中单个全连接层(FC)表现最优。具体而言,在特征适应器通过寻找一个映射空间中的投影点实现了这一目标;经评估发现,在所有配置中单个全连接层(FC)表现最优。值得注意的是,在提升模型性能的过程中发现功能适应器能够显著加快网络收敛速度。

在这里插入图片描述

主干网络的选择:采用ResNet18、ResNet50、ResNet101与WideResNet50分别进行测试,并发现WideResNet50在I_AUROC和P_AUROC指标上均表现出色;最终确认 WideResNet50 为主干网络

在这里插入图片描述

噪声强度:在异常特征生成器中,噪声规模直接影响生成的异常样本与正常样本之间的距离。当σ较大时,生成的异常样本与正常样本之间的欧氏距离显著增大。这种情况下对模型进行过拟合训练可能导致分类器的决策边界变得较为松散,并进而引发高误判率(高假阴性)。相反地,在模型训练过程中若选择较小的σ值,则可能会导致训练过程出现不稳定性,并使得鉴別器难以有效地推广到正常的测试样本上。图中展示了不同类别在MVTec AD数据集上的σ变化情况,在此过程中选取σ=0.015时能够实现较好的平衡,并且在测试中取得了最佳的性能水平。

在这里插入图片描述

全部评论 (0)

还没有任何评论哟~