深度学习用于图像超分辨率重建综述——超分辨率(一)_multi-view super-resolution reconstruction using d(1)


丰富的网上学习资料一 pile, 但如果所学的知识缺乏系统性, 遇到问题时停留在表面, 不再深入探究, 难以实现真正的技术突破。
想要获取详细内容的读者,请点击这里
单独行动时效率很高;但如果组成团队合作,则能够走得更远。无论你是已经在IT领域有一定经验的老 Bird ,还是对 IT 行业充满热情的新手 ,我们都热忱欢迎你的加入!让我们一起在技术交流中分享经验,在学习资源中提升自我,在职场吐槽中找到共鸣,在大厂内推中开拓视野,在面试辅导中从容应对——共同进步与成长吧!
基于升采样的作用和应用模式的不同特点,在对超分网络结构进行分类时可以将其划分为四大部分:首先,在网络架构的前端部分采用预增广的策略实现信息增强;其次,在后部结合多尺度特征提取技术提升细节重建能力;第三,则是通过渐进提升的方式生成高分辨率特征图;最后则是在深度学习框架中引入迭代增减采样操作以逐步优化特征表示能力。


低分辨率端的超分网络通常采用双三次插值算法将输入图像转换为目标分辨率空间,并通过深度卷积网络等模型生成高质量细节信息。这种方法显著降低了学习复杂度的同时也大大提高了效率,在实际应用中表现良好但存在不足之处:首先该方案容易导致模糊化现象并加剧噪声放大问题;其次由于前端处理时已经将图像转换为高分辨率空间因此后续处理所需的计算资源投入远高于其他类型超分架构;此外该方法难以有效应对多尺度超分任务并可能导致性能瓶颈。
基于端到端可学习设计的提升模块在神经网络架构的最后几层或顶层完成对输入图像的空间重构工作主要依赖于降维操作以减少后续计算开销这一特性使其成为主流超分框架的基础组件之一。
针对多尺度超分问题和较大倍增因子的情况一种更为先进的渐进式提升策略被提出这种方案通过多级重建过程逐步逼近目标高分辨结果从而有效缓解了传统方法在处理大倍率场景时面临的挑战。
参考反向投影技术构建了一种新型迭代优化框架该方法通过交错提升与降级策略实现了对最终结果的高度优化其核心思想在于综合考虑了所有中间输出特征并在此基础上构建出完整的重建流程从而达到了良好的性能效果。
2. 可学习的升采样方法
- 转置卷积(transpose convolution),也可称为反卷集运算符(reverse convolution),其等价于正常二维互相关运算的一种逆过程,并可在常规深度学习框架中实现。
- 亚像素级联模块通过常规的方式处理数据,在完成特征提取后将结果进行shuffling操作以达到分辨率一致的效果。相较于传统转置层的优势在于显著提升了空间感知能力,并且能更好地捕捉细节信息;然而,在每个小块区域内的感受野分布不均会导致边缘区域出现伪影现象。

3. 全局和局部网络结构设计
- 残差学习(residual learning),在ResNet被提出之前,在超分领域对残差进行学习的思想已经在很多研究工作中出现。其中,全局残差学习(global residual learning)只是学习插值后得到的图像和高分辨率图像之间的残差,通过学习一张残差图来恢复高频细节;而局部残差学习(local residual learning)则类似于ResNet中的短连接(shortcut connection)。
- 递归学习(recursive learning)可以不引入额外参数的同时,大大增加网络的感受野,做法就是递归地多次使用同个模块,例如对同一卷积层递归使用多次,还有将大的超分倍增系数的问题,分解成多个子问题,使用递归的网络子结构来解决等等。但是,递归学习容易出现梯度消失和爆炸的问题,需要将残差学习和多级监督等策略融入进来以减轻这些问题。
- 多支路学习(multi-path learning)主要思路是为网络设计多条支路来提升模型的容量和表达能力,分为全局多支路学习(global multi-path learning)、局部多支路学习(localmulti-path learning)、尺度相关的多支路学习(scale-specificmulti-path learning)等
- 稠密连接(dense connections),是与DenseNet紧密联系的,稠密连接被引入图像超分问题,不仅可以减轻梯度消失的问题,还可以对特征进行重用,提升效果,在使用小的增长率(growth rate)时,可以很好地控制参数量,目前越来越受到关注和使用。
- 通道重缩放(channel attention)是考虑特征表达中不同通道之间的关系,通常是引入一些额外的小结构来按通道(channel-wise)进行重缩放(rescale)。
- 高级卷积结构(advanced convolution),近来受到关注的主要是空洞卷积(dilated convolution)和成组卷积(group convolution)两种。
- 像素递归学习(pixel recursive learning),这类方法是逐像素生成(pixel-by-pixel generation)高分辨率图像的,可以更好地捕获全局上下文信息和像素序列生成时的相关性,但是计算代价很高,同时训练也比较复杂。
- 金字塔池化(pyramid pooling)通常使用多个不同的尺度参数,来聚合全局和局部上下文信息。
- 小波域变换(wavelet transformation)分别对高分辨图像和低分辨率图像进行小波变换,在不同的子频带(sub-bands)进行映射学习。
4. 损失函数设计
- 像素级(pixel loss),主要比较两幅图像像素级的差别,包括L1和L2损失,近来研究表明L1损失可以取得更好的性能和收敛速度。这类损失没有对图像内容和语义进行评价,通常会产生过于平滑的超分结果。
- 内容损失(content loss),主要是从图像内容理解和感知层面对图像质量进行评价,通常使用预训练好的图像识别(如VGG和ResNet等)网络,比较中间某些层的特征图之间的欧式空间距离。
- 纹理损失(texture loss),想法来源于风格迁移工作中,重建图像应该与原始图像有相同的风格(颜色、纹理、对比度等)。因此,纹理损失又称为风格重建损失(style reconstruction loss),一般使用不同特征通道的相关性来度量。
- 竞争生成损失(adversial loss),随着GAN的兴起,竞争生成网络中生成器和判别器的思路被引入超分问题,超分网络即是生成器(generator),另外定义一个判别器来判断输入的图像是否为生成的。在这种损失函数中,也可以借鉴内容损失的想法,判别器使用图像的高层表达来进行判断。
- 往复一致性保持损失(cycle consistency loss),受CycleGAN的启发,通常是在两阶段生成时,保持再次生成的图像和原始输入相同。
- 全变分损失(total variation loss),主要是为了抑制生成图像中的噪声,一般定义是相邻像素之间差的绝对值,引入全变分损失可以使图像变得平滑。
- 基于先验知识的损失(prior-based loss),通过一些外部已知的先验,作为一些约束放入损失函数,例如人脸超分对关键点的约束等。
5. 批归一化
具体而言
6. 课程学习
Curriculum learning(课程学习)采用循序渐进的方式提升挑战性;图像超分问题涉及多个挑战性因素包括巨大的放大倍数噪声和模糊等;这种逐步增强策略能够显著地提高训练效果;例如可以将8×的超分任务划分为三个阶段分别是1×到2×2×到4×以及4×到8×为每个阶段单独设计一个网络模型。
7. 多级监督
multi-supervision引入多个额外的 supervision 以显著降低网络学习过程中的 gradient 消失与爆炸问题。它可以 通过在 递归式 结构中应用 多级 监督策略来实现这一目标;即 对每一级 递归 所产生结果 进行 监督 。通常来说,在 损失函数 中加入若干相关项 是多级 监督 表现形式的一种常见做法。
8. 其他网络设计和学习策略
- 基于上下文的网络融合机制(context-wise network fusion, CNF)通过集成多个超分网络模型的结果实现了信息的有效整合。
- 数据增强技术(data augmentation)主要包括随机裁剪、翻转、缩放、旋转以及轻微色彩抖动等传统方法;近期研究还提出了重新排列RGB三个颜色通道的新颖增强策略。
- 多任务学习方法(multi-task learning)旨在利用与超分相关的任务所蕴含的专业领域知识以提升模型的泛化能力;具体而言可以通过独立训练去噪与超分两个子任务模型并结合预训练语义分割网络提供的语义信息来构建完整的特征表示。
- 网络插值方法(network interpolation)通过在两个子网络之间建立参数插值关系实现了视觉质量与保真度之间的平衡;该技术无需重新训练即可生成中间效果显著的超分重建模型。
- 图像自融合算法(self ensemble)通过多角度变换生成多组候选图像并结合其对应的高分辨率重建结果最终通过加权平均或取均值得到稳定的超分输出;该方法完全依赖原始输入而无需额外计算开销具有较高的计算效率和实用性。
9. 无监督图像超分辨率
基于监督学习的方法实现了一种新的图像超分辨率算法;这种算法旨在模拟由人工设计所定义的人为降质过程逆向生成高清晰度影像;通常情况下该算法需要成对标注的数据集来进行训练;然而,在真实场景中的超分问题并不满足这一前提条件;在实际情况中进行超分处理时,则必须依赖于大量未配对的数据样本;近年来无监督图像超分辨率方法的研究热度持续上升
- 零样本学习的图像超分
基于图像自身内容的统计信息可以为超分提供支持。因此可以推断,在测试阶段建立专有图像的超分网络更为高效。具体来说,在单张测试图像中应用核估计方法(kernel estimation)即可估计降质过程参数。然而这种方法在每张测试图像上都需要单独建立一个网络模型而导致计算开销较大。
- 弱监督学习的图像超分
目前在弱监督学习环境下进行图像超分研究主要分为两类:一类主要关注从高分辨率到低分辨率的降质过程;另一类则致力于同时实现低分辨率向高分辨率的重建。其中一种模式涉及从高分辨率到低分辨率再到高分辨率的过程(cycle-in-cycle结构)。
- 深度图像先验
当前研究主要采用随机参数初始化的卷积神经网络(CNN)作为深度图像预处理模型,并将其视为传统超分辨率重建过程中的先验模型。
10. 超分在专有领域的应用
在当前领域内对图像进行超分的能力主要体现在以下几个方面:首先采用深度学习驱动的图像增强技术实现对复杂背景下的目标物细节恢复;其次基于面部识别技术的人脸放大与修复方案能够有效改善局部面部质量;再次通过利用多光谱数据进行精准去噪与重构的技术提升高光谱图象的清晰度;此外支持动态视频分辨率提升的方法能够满足实际应用需求;最后针对微小目标物实时跟踪的技术为检测分割中的小物体提供了可靠保障
发展趋势
以下围绕超分网络结构设计、学习策略与评价指标等主要方面展开论述,并探讨一下图像超分领域的无监督学习及实际应用场景。
1. 网络结构设计
- 综合局部与全局数据
- 整合基础层与高级层特征
- 基于不同语境下的自适应注意力机制
- 优化后的网络架构
- 上采样模块的技术优化
2. 学习策略
- 精确表达图像差异的损失函数设计
- 适合图像超分的归一化方法


网上学习资料堆积成山(piled up),但如果所学知识缺乏系统性(lacking systematics),遇到问题时仅满足于浅尝辄止(shallow exploration)而不再深入探究(in-depth investigation),那么就难以实现真正技术突破(true technical advancement)。
如需获取这份系统化的资料,请您点击此处访问
一个人的速度很迅速;然而一群人才能达到更远的距离。无论你是已经在IT行业有一定经验的老鸟者还是对此领域充满热情的新手,请随时加入我们的圈子(技术交流群组、丰富的学习资源库以及职场吐槽区等)。这里有最全的技术教程合集(包括但不限于编程知识分享),各类职业发展指导课程(如求职技巧培训与企业内推渠道推荐),以及大量真实职场案例分析(帮助你快速掌握工作技能)。
)**
单兵作战的能力较强,在团队协作中则能够展现出更大的价值!无论你是IT行业的资深从业者或是新兴领域的学习者,请您放心地加入我们的专业社群(技术交流群组、深度学习资源分享空间、职场感悟倾诉平台、顶尖企业内推渠道以及系统化面试指导课程),让我们共同进步与成长吧!
