All-in-One Image Restoration for Unknown Corruption论文阅读

阅读量：

All-in-One Image Restoration for Unknown Corruption

- - 1. 论文的研究目标与实际意义
  - - 1.1 研究目标
- 1.2 实际意义

整体架构

本节详细阐述创新方法：AirNet模型

整体架构

2.3 退化引导恢复机制（DGRM）
- 2.3.1 层次结构
- 2.3.2 退化引导单元（DGM）
- - 组件1为可变形变换（DCN）
  - 组件2为空间特性转换（SFT）
  - 2.4 与现有方法对比优势
  - 关键公式汇总
3. 实验方案及结果展示
- - 3.1 实验方案设计
- 3.2 核心数据与分析
- - 3.2.1 单一退化解性能评估
  - 3.2.2 多模态退化解性能对比（见表4）
  - 3.2.3 空间变异性退化解特性分析
    - 4. 未来研究方向
    - - 4.1 挑战与机遇
  - 4.2 技术转化潜力
    - 5. 批判性视角
    - - 5.1 局限性
  - 5.2 存疑点
    - 6. 实用创新点与学习建议
    - - 6.1 核心可复用技术
  - 6.2 学习建议

1. 论文的研究目标与实际意义

1.1 研究目标

论文致力于解决图像恢复领域中的一个关键难题：如何构建一种统一的框架（All-in-One）以应对各种未知降质类型及降质程度。传统的解决方案通常为每种特定降质现象（如噪声、雨雾模糊）设计独立的算法，在实际应用中难以满足复杂场景的需求。AirNet的目标则是：

The system can reconstruct images from multiple unknown degrading types and levels.

1.2 实际意义

行业应用潜力：
- 智能化系统（涵盖自动驾驶、无人机等）：在动态环境下实现智能感知与决策（如雨雾天气共存时）。
- 低能耗架构设计：通过优化算法减少计算资源消耗。
- 医学图像处理与遥感技术：有效应对未知的图像噪声和环境干扰问题。
重大技术进展：
引导图像恢复技术向更具普适性的方向发展, 融入当前AI模型发展的泛化能力与适应需求.

2. 创新方法：AirNet模型详解

2.1 整体架构

AirNet由两个核心模块组成：

对比退化编码器（CBDE, Contrastive-Based Degraded Encoder）是从带有降质特性的图像中识别出隐含的空间降质特征的过程。
该编码器通过非监督学习方法捕获图像中的局部特征差异，并生成一个反映其降质状态的低维表示向量。
在实现过程中，我们采用了一种基于自监督学习的方法来优化编码器的性能。

图2展示了AirNet架构及其组成部分。(a)整体框架体现了各子网络之间的交互关系；(b)CBDE模块基于对比学习生成了一种新的退化表征表示方法 $z$ ，其中其保留了空间结构特征。(c)在DGRN网络中，则采用了一种基于动态调节的机制来实现对DCN偏移量及SFT参数值域范围的有效控制。(d)具体而言,DGM模块能够接收来自 $z$ 的动态反馈信号,并结合红色箭头所示的DCN偏移量变化及蓝色箭头指示的SFT参数调整范围,从而实现了对网络退化的自适应修复过程。

2.2 对比退化编码器（CBDE）

2.2.1 设计目标

学习退化表征 $z$ ，使其满足：

判别能力：同一退化类别中的图像特征较为相近，在不同退化类别之间则表现出良好的分离特性。（论文3.2节）*
语义空间保持能力：输出采用张量形式以保持完整的语义关联关系。（论文3.2节）*

2.2.2 对比学习机制

正负样本构造 （论文3.2节）：

对输入图像 $x$ ，我们通过随机选取两个区域 $x_q$ 和 $x_{k+}$ 来生成正样本对（这些区域基于同一图像的退化处理）。
我们从其他图像中选取区域 $x_{k-}$ 作为负样本。

对比损失函数（公式3）：该损失函数定义为负对数形式，在分子项与分母项之间的比值取其自然对数值，并通过求和运算符将所有分母中的指数项累加起来

$q$ ：查询图像的退化表征。

$k^{+}$ ：同退化图像的“正样本”表征。

$k_i^{-}$ ：不同退化的“负样本”表征。（通过两层MLP生成）

$\tau$ ：温度超参数。

创新点 ：

不必显式地建立退化模型，在未标注数据中直接学习退化特征。
采用空间裁剪的方法构建正负样本对（同一图像中的两个区域被视为正样本）。

Our method does not rely on a mathematical model that explicitly defines the relationship between the corrupted and clean images.

2.3 退化引导恢复网络（DGRN）

2.3.1 层级结构

每个**退化引导组（DGG）由5个独立的退化引导块（DGB）**构成。
- 每个退化引导块（DGB）内部又包含两个独立的退化引导模块（DGM）。
其中每个**退化引导模块（DGM）**结合了两种不同的操作机制：可变形卷积（DCN）与空间特征变换（SFT）。

2.3.2 退化引导模块（DGM）

数学定义（公式4） ：
$F_{\text{DGM}}(t, m, b, g) = \Phi_{\text{DGM}}(t, m, b, g; F(t-1, m, b, g), z)$
$= \Phi_{\text{DCN}}(t, m, b, g; F(t-1, m, b, g), z) + \Phi_{\text{SFT}}(t, m, b, g; F(t-1,m,b,g), z)$

$m,b,g$ ：DGM、DGB、DGG的索引。
$F^{m-1,b,g}$ ：前一模块输出特征。

子模块1：可变形卷积（DCN）

动态感受域优化（公式5-6）：
$\begin{align*}\Psi_{\text{DCN}}(F^{m−1}|z)=\sum_{k=1}^K w_k\cdot F^{m−1}\left(p+p_{k}+\Delta p_{k}\right)\cdot Δm_k\end{align*}$

p_k：固定偏移（例如，在3×3卷积中涉及9个位置）。
- $\Delta p_k, \Delta m_k$ ：可动态学习的位移与缩放因子，由以下关系式计算：
  $(\Delta p_k, \Delta m_k) = \text{conv}(\text{concat}(F^{m-1}, z))$ $

通过融合特征图 $F^{m-1}$ 和降维表征 $z$ 估计偏移量, 以应对不同退化程度的空间变化规律(如局部降噪程度变化)。

子模块2：空间特征变换（SFT）

特征分布的对齐（见公式8）：
该数学表达式的计算结果等于特征矩阵 $F^{m-1}$ 与权重矩阵 $\gamma$ 按元素乘法运算后再加偏置项 $\beta$ 的结果，并满足关系式 $(\gamma, \beta) = \mathcal{M}(z)$ 。其中参数向量 $\gamma$ 和 $\beta$ 分别由函数 $\mathcal{M}$ 输出

$\mathcal{M}$ ：用于表示由两个卷积层构成的映射函数 $\mathcal{M}$ 生成缩放因子 $\gamma$ 和偏移量 $\beta$ 。
$\odot$ ：该操作为逐元素乘法运算。

利用仿射变换优化特征分布，并减小不同退化类型之间的统计差异（例如雾霾与雨纹之间的差异）。

2.4 与现有方法对比优势

方法类型	代表模型	需退化先验	多退化处理	自适应机制
单任务专用模型	DnCNN[53]	是（噪声水平）	❌	固定卷积核
多分支模型	DL[8]	是（类型/程度）	✔️（多分支）	预定义分支选择
统一模型	AirNet	❌	✔️（单分支）	DCN+SFT动态调整

核心优势 ：

无需先验推理：该方法无需依赖先验知识以预判退化类型及其程度（例如无需输入噪声水平 $\sigma$ ）。
具有较高的经济性和效率：通过一个通用模型取代多个专门化的模型（其存储规模缩减约三分之一以上）。
具备空间自适应性：深度可分离网络（DCN）能够动态调节感受野的大小，并且能够有效地处理局部区域的退化变异问题（例如见表6中的PSNR提升值达5.32 dB）。

关键公式汇总

公式	表达式	作用
总体损失 (1)	$\mathcal{L} = \mathcal{L}_{\text{Rec}} + \mathcal{L}_{cl}$	联合优化图像重建与退化表征
重建损失 (2)	$\mathcal{L}_{\text{Rec}} = \frac{1}{T} \sum_{i=1}^{T}$	$f(x_i) - y_i$
对比损失 (3)	$\mathcal{L}_{cl} = -\log \frac{\exp(q \cdot k^{+}/\tau)}{\sum_i \exp(q \cdot k_i^{-}/\tau)}$	拉近正样本、推开负样本
DCN偏移预测 (6)	$(\Delta p_k, \Delta m_k) = \text{conv}(\text{concat}(F^{m-1}, z))$	动态生成卷积偏移量
SFT变换 (8)	$F_{\text{SFT}} = \gamma \odot F^{m-1} + \beta$	特征分布对齐

3. 实验设计与结果

3.1 实验设置

数据集 ：
- 去噪：BSD68、Urban100（σ=15/25/50高斯噪声）。
- 去雨：Rain100L。
- 去雾：RESIDE-SOTS。
对比方法：当前先进算法数量达到17种（包括DnCNN、DIDMDN、DehazeNet等）。
- 指标：基于这些指标进行评估与分析包括峰值信噪比（PSNR）和结构相似度（SSIM）。

3.2 关键结果

3.2.1 单退化任务性能

去噪（表1）：

Method	BSD68 (σ=50)	Urban100 (σ=50)
BRDNet[40]	28.16/0.7942	28.56/0.8577
AirNet	28.23/0.8057	28.88/0.8702

AirNet在噪声强度σ=50时PSNR/SSIM全面领先。

去雨（表2）：

Method	PSNR	SSIM
LPNet[11]	33.61	0.9583
AirNet	34.90	0.9660

去雾（表3）：

Method	PSNR	SSIM
FDGAN[7]	23.15	0.9207
AirNet	23.18	0.9000

3.2.2 多退化混合任务（表4）

Setting	Method	Avg PSNR
One-by-One	MPRNet[51]	31.98
All-in-One	AirNet	31.20

AirNet在统一训练模式下仍优于专用模型（如MPRNet）。

3.2.3 空间变异退化（表6）

Method	PSNR	SSIM
DL[8]	26.10	0.7528
AirNet	31.42	0.8922

在局部噪声程度不同的合成数据上，AirNet显著领先。

4. 未来研究方向

4.1 挑战与机遇

拓展退化场景：探索新增加的模糊（blur）和雪景（snow）等未覆盖情况。
优化效率：降低对计算资源的需求（研究结果表明，在训练过程中需要大量GPU支持）。
理论分析：深入探讨多重退化情况下性能波动的根本原因（例如表5中的'去雨助去噪'现象）。
零样本泛化：The zero-shot generalization phase focuses on training new degenerate combinations, such as the combination of noise, rain, and雾.

4.2 技术转化潜力

边缘设备部署方案 ：采用轻量化的CBDE与DGRN组件进行边缘设备构建。
- 动态环境监控系统 ：实现实时跟踪并适应天气变化的车载监控技术。
- 医学影像开发公司 ：致力于开发适用于医学成像的通用退化校正工具（例如在MRI中用于消除运动伪影影响）。

5. 批判性视角

5.1 局限性

未能涵盖所有类型的退化 ：未能测试包括模糊效应在内的常见失真类型。
- 计算资源消耗较大 ：训练过程需要执行1500次迭代步骤，并采用多GPU加速；此外该方法的环境影响明显（参考论文6.2节）。
- 实验限制如下 ：
  - 当前研究仅针对噪声干扰、雨天图像以及雾霾影像进行了实验验证。
  - 方法尚未与Restormer等最新统一去模糊模型进行对比实验。

5.2 存疑点

适用性：该模型在真实无标注数据（非合成退化）的表现尚待评估。
- 贡献度：目前仅进行了CBDE与DGRN部分的解耦测试，并未全面评估其影响。

6. 实用创新点与学习建议

6.1 核心可复用技术

对比学习机制：基于对比学习框架构建了一种无监督表征生成方法。
- 深度重建辅助技术：DCN+SFT模型引入了一种灵活集成的自适应模块（可在多种重建任务间无缝切换）。
- 无需先验知识：该方法展现出卓越的实时处理能力，并适用于动态适应输入的各种场景（如视频修复、图像去噪等）。

6.2 学习建议

深入理解 ：
对比损失函数（公式3）的具体实现过程。
DGM模块内DCN与SFT之间的协同运作机制。
补充背景 ：
1. 对比学习方法（Contrastive Learning）主要涉及MoCo[14]和SimCLR[4]等技术。
2. 可变形卷积技术（Deformable Convolution）则在文献[6][56]中有详细探讨。
3. 空间特征变换方法（Spatial Feature Transform）则参考文献[44]进行了深入研究。

启发：将退化的现象抽象为任务隐变量的形式，并进一步应用于多个动态领域（包括但不限于低光环境下的图像恢复、传统照片的修旧工作等）。

全部评论 (0)

还没有任何评论哟~

All-in-One Image Restoration for Unknown Corruption论文阅读

AllinOneImageRestorationforUnknownCorruption 1\.论文的研究目标与实际意义 1.1研究目标 1.2实际意义 2\.创新方法：AirNet模型详解 2.1整...

【读点论文】All-In-One Image Restoration for Unknown Corruption用对比学习统一方法实现多种噪声图片的有效处理

AllInOneImageRestorationforUnknownCorruption Abstract 在本文中，我们研究了图像恢复中的一个挑战性问题，即如何开发一种能够从各种未知损坏类型和程度中...

Simple Baselines for Image Restoration论文阅读

SimpleBaselinesforImageRestoration 1\.论文的研究目标与实际意义 2\.创新方法、模型与公式分析 2.1架构简化：降低系统复杂度的核心策略 2.2基线模型演进：从P...

【论文阅读】Pyramid Attention Networks for Image Restoration

论文地址论文代码参考博客参考知乎具体细节注意力机制（Attention）NonlocalNeuralNetworks 图像非局部均值滤波的原理 Nonlocal模块与Selfattention...

Shrinkage Fields for Effective Image Restoration论文阅读

ShrinkageFieldsforEffectiveImageRestoration 1\.研究目标与实际意义 2\.创新方法：收缩场（ShrinkageFields） 2.1核心思路与技术突破 2...

Deep Mean-Shift Priors for Image Restoration论文阅读

DeepMeanShiftPriorsforImageRestoration 1\.论文的研究目标与实际意义 2\.创新方法：深度均值漂移先验（DeepMeanShiftPrior） 2.1核心思想与...

Deep Generalized Unfolding Networks for Image Restoration论文阅读

DeepGeneralizedUnfoldingNetworksforImageRestoration 1\.论文研究目标与实际意义 2\.创新方法：DeepGeneralizedUnfoldingN...

论文阅读：Simltaneous Fidelity and Regularization Learning for Image Restoration

SimltaneousFidelityandRegularizationLearningforImageRestoration 写在最前面：本文主要是对论文阅读的记录，方便日后的查阅等工作。 1.概...

论文阅读-Learning Deep CNN Denoiser Prior for Image Restoration

ZhangK,ZuoW,GuS,etal.LearningDeepCNNDenoiserPriorforImageRestoration[J].2017. 1.引言图像恢复（imagerestora...

阅读论文《Loss Functions for Image Restoration With Neural Networks》

这是去年计算成像学领域的一篇论文（链接：<https://ieeexplore.ieee.org/document/7797130/），重在讨论如何损失函数对图像恢复的影响。在目前的图像恢复任务中主要...

是否确定退出登录?

All-in-One Image Restoration for Unknown Corruption论文阅读

All-in-One Image Restoration for Unknown Corruption

1. 论文的研究目标与实际意义

1.1 研究目标

1.2 实际意义

2. 创新方法：AirNet模型详解

2.1 整体架构

2.2 对比退化编码器（CBDE）

2.2.1 设计目标

2.2.2 对比学习机制

2.3 退化引导恢复网络（DGRN）

2.3.1 层级结构

2.3.2 退化引导模块（DGM）

子模块1：可变形卷积（DCN）

子模块2：空间特征变换（SFT）

2.4 与现有方法对比优势

关键公式汇总

3. 实验设计与结果

3.1 实验设置

3.2 关键结果

3.2.1 单退化任务性能

3.2.2 多退化混合任务（表4）

3.2.3 空间变异退化（表6）

4. 未来研究方向

4.1 挑战与机遇

4.2 技术转化潜力

5. 批判性视角

5.1 局限性

5.2 存疑点

6. 实用创新点与学习建议

6.1 核心可复用技术

6.2 学习建议

全部评论 (0)

相关文章推荐

All-in-One Image Restoration for Unknown Corruption论文阅读

【读点论文】All-In-One Image Restoration for Unknown Corruption用对比学习统一方法实现多种噪声图片的有效处理

Simple Baselines for Image Restoration论文阅读

【论文阅读】Pyramid Attention Networks for Image Restoration

Shrinkage Fields for Effective Image Restoration论文阅读

Deep Mean-Shift Priors for Image Restoration论文阅读

Deep Generalized Unfolding Networks for Image Restoration论文阅读

论文阅读：Simltaneous Fidelity and Regularization Learning for Image Restoration

论文阅读-Learning Deep CNN Denoiser Prior for Image Restoration

阅读论文《Loss Functions for Image Restoration With Neural Networks》