论文解读《Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network》SRGAN
1 文章介绍
文中所述的方法涉及一种名为SRGAN的技术。这种技术属于深度神经网络模型的一种应用形式,并通常被视为首个能够在4倍放大因子下生成逼真自然图像的系统。研究者在此基础上提出了一种新的感知域内损失函数定义:其中包含对抗成分与内容保留两部分。在此研究中发现,在感知域内计算相似性比在像素层面上更为有效。通过一系列综合评估指标进行验证:与现有最先进的超分辨率重建方法相比

2 文章贡献
• 基于视觉质量指标(PSNR和SSIM)评估高放大型图像超分辨率技术的效果。
• 采用多层感知机模型结合内容分支损失替代均方误差作为训练目标函数,在VGG网络特征图上进行优化处理。
• 通过对三个公开基准数据集中的图像进行多维度评价指标测试(MOS评分),验证了所提出的SRGAN算法在性能上的显著优势。
3 loss函数
loss分为两部分,分别为content loss和对抗型adversarial loss:以下为总公式,可以看出这两个损失项的权重分配情况

3.1 content loss
作者没有使用传统的l1或者l2loss,而是使用了如图所示的loss

作者指出传统损失函数在处理图像高频细节时表现出不足之处,因此作者采用了此特定损失函数.此处源自于VGG19网络中第i个最大池化层之前第j层卷积作用后的激活特征图生成.值得注意的是,该损失函数的本质是计算重构与参考图像特征图之间的欧氏距离.
3.2 adversarial loss
对抗loss是常用的对抗loss

4 网络结构
作者给出的图非常清楚,k:卷积核,n:feature map,s:步长

生成网络结构,基于Resnet网络结构;
识别网络架构中采用LeakyReLU激活函数(斜率系数为0.2),其特征图的层数从64扩展至512,并随后连接两组全连接层以及一个Sigmoid激活层;该网络模型旨在用于计算两张图像是否为同一实例的概率;
5 数据集
三个广泛使用的基准数据集Set5 [3],Set14 [69]和BSD100(BSD300的测试集[41])上进行了实验。
6 实验结果
1) MOS评价

这里的SRGAN在HR的MOS分布中表现得更为契合。

