Advertisement

CAT-Net: Compression Artifact Tracing Network for Detection and Localization of Image Splicing

阅读量:

图像篡改检测的定位分为三类 : 基于块的检测 ,补丁检测,和像素级的检测

视觉线索和压缩伪影 :可以作为两个依据来判定图像的篡改

视觉信息的本质即像素间的相互作用关系。对于那些仅将视觉线索作为网络安全检测唯一依据的系统而言,在纯色背景上进行内容复制粘贴的行为会被系统视为安全。然而,在表格篡改或标语篡改的情况下,则会暴露这一漏洞。

压缩伪影具体指代JPEG压缩过程中所使用的DCT矩阵,在实际应用中这种技术通常被用于检测双层压缩留痕。至于像ELA这样的相关技术,则主要用于分析和识别这些痕迹

池化 :研究结果表明不适于图像篡改检测;通过增强图像内容并减弱噪声信号来达到目标。池化在计算机视觉的其他领域可能表现良好;但在图像篡改检测领域中会破坏像素间的细微联系而导致检测失败。

在这里插入图片描述

近年来该网络结构备受关注,并采用多分辨率融合技术,在过去一年内已连续两年发布相关研究进展

该网络架构具有很高的理论价值。经过多层次信息融合后得到的结果包含了多种分辨率的数据,并且其中包含多种尺度特性的提取内容。其中还涉及通过低维特征提取进一步分析的信息。

总体而言,该过程是将来自像素线索和压缩伪影线索的信息依次送到两个独立的数据流中,并随后将这两个数据流的结果经过特征融合器完成特征融合的过程。

不同的尺度之间融合详细

下采样 用的 不是池化,而是步长为2 的3*3卷积。

把不同尺度的特征变换大小之后相加。

在这里插入图片描述

噪声伪影流

这一块没怎么看明白。

在这里插入图片描述

该线路中的所有卷积操作均基于上图所示quantization table进行描述,并整体构成一个残差模块。

在这里插入图片描述

convert to binary volume

将DCT矩阵转换为二进制矩阵。
二进制矩阵是一种将数据表示为0和1的形式的矩阵。
T参数代表区间长度,在这里类似于归一化处理,将所有元素标准化到[-T, T]范围内。
通过划分不同的绝对值范围(从0到T),我们将这些值分配到(T+1)个独立的矩阵通道中。
每个通道对应一个绝对值范围。

作者认为T应当为20最优。

在这里插入图片描述

输入不是jpg图片情况

仅限于 jpg 格式的图像才具备 dct 矩阵及其相关的量化表。
若该算法仅能处理 jpg 图片,则其应用性能尚可。
因为 jpg 压缩率高,
能有效减少数据传输量,
同时还能缓解对网络流量的需求,
并且占据了大量网络上传图片的数量。

当输入为其他格式图像时, 人工求取DCT矩阵. 基于像素值进行运算?能够实现将任意格式图片转换为JPEG并进行编码. 统一设定所有量化矩阵, 并将压缩系数设定在100%. 从而使得网络具备处理任意图片的能力.

DCT计算 该文章详细阐述了DCT(离散余弦变换)的计算过程及其在图像压缩中的应用。

结果展示

通常情况下,在进行篡改检测论文的研究时,结果展示会采用原始图片、真实数据(ground truth)以及对比图表的形式进行呈现。研究者们倾向于使用黑白图片作为实验输出以突出特征差异

然而,这种将预测结果图中的TP、TN、FP、FN以突出颜色标示的方法尚属首次 notice。这种方法能够缓解结果展示单一色调呈现的问题。

在这里插入图片描述
在这里插入图片描述

全部评论 (0)

还没有任何评论哟~