【红外与可见光图像融合】Infrared and visible image fusion based on a two-stage class conditioned auto-encoder ne

阅读量：

本文探讨了一些基于共享编码器的方法用于从源图像中提取特征，并采用了手工设计的融合策略以整合不同模态的信息。我们的研究目标是通过在编码器中引入类嵌入模块来增强多模态特征表示的能力，并根据输入数据自动调节中间层特征的比例系数以优化表示效果。在融合策略方面，则采用了通道注意力机制与空间注意力机制相结合的方式对各子网络输出的特征图进行加权融合处理。
实验过程与RFN-NEST方法具有相似性，在模型训练过程中采用了两阶段优化策略，在损失函数设计上做了适当调整。
需要注意的是本研究未对外界提供相关代码实现，
完整的研究成果发表在Neurocomputing期刊上，
时间戳为2023年。

作者的核心观点是通过编码器学习不同模态图像的独特特征。为此引入了一个类嵌入向量，并经过初始阶段的训练促使编码器建立基于不同图像的模型结构。并采用了交叉熵损失函数作为评估标准，在这部分的数据中作者可能对训练集进行了优化或调整。例如进行人工标注分类任务，并根据结果进行相应的优化和改进。

第一阶段训练：

IR和VIS分别提取特征，就是双分支

没有融合层，初始化类嵌入向量

（训练后就与encoder一起固定了）

这两个初始化操作通过5个全连接层实现输出向量Ec的生成。随后将各层输出经拼接处理后输入到分类器中，在网络结构中嵌入这3个特定模块。

编码器利用紧密连接将经过调整的特征与小分类器头部的模态分类任务相联系，并将其发送到这里以完成该任务。这一任务隐含地促使编码器从不同模态中提取特定的特征。

在第二阶段的训练中不再依赖该分类器，在此期间通过固定类嵌入以及源图像进行训练，并在此处插入融合层

Ec根据类执行AdaIN操作：

CCB利用潜在类嵌入EC中的类特定差异信息进行归一化处理过程, 使得编码器能够根据输入图像的类别灵活地调整特征, 并增强编码器对输入图像的理解能力。

Pixel difference networks for efficient edge detection

这个分支仅使用卷积操作，并命名为content path；通过其与另一条路径的交互实现了预融合。

第一阶段损失：

第二阶段损失：

sobel 算子

我们主张两个源图像中的梯度同样重要，并引入一个辅助目标以约束融合图像的梯度信息。

这里参数设置为0.6，也就是更偏向IR一点点。

消融实验：

作者这里输出了不添加类嵌入向量和添加之后的编码器提取的特征

典型主观图

告示牌上的白条纹依然清晰可见，并非完全光滑无瑕；除了左上角外，在其余位置均未发现明显的雕刻痕迹。（某一篇论文里的表述）

全部评论 (0)

还没有任何评论哟~

【红外与可见光图像融合】Infrared and visible image fusion based on a two-stage class conditioned auto-encoder ne

本文提到一些方法使用共享编码器从源图像中提取特征，并且采取手工制作的融合策略。我们的目的是让编码器从源图像中提取出不同的特征，因此我们在编码器中引入了类嵌入分支，对不同模态的特征进行建模，并根据输入模...

【红外与可见光图像融合】GuideFuse: A Novel Guided Auto-Encoder Fusion Network for Infrared and Visible Images

1、动机目前深度网络有很强的语义表达能力，但还是难免损失一些细节。为了更好地保持源图像的细节，我们使用梯度来引导网络的训练。计算源图像的梯度图，并且计算了一个梯度值GV，一起引导解码器重建图像。 ...

【红外与可见光图像融合】Semantic perceptive infrared and visible image fusion Transformer

大多数方法关注到了全局信息建模和局部特征，但很少考虑到语义信息的建模，这可能导致信息保持不充分。我们提出的SePT使用CNN提取局部特征，并通过Transformer学习长距离依赖，同时，设计了两个...

【红外与可见光图像融合】Rethinking Cross-Attention for Infrared and Visible Image Fusion

本文的角度也很新奇，之前的transformer倾向于提取两种图像的共同信息，忽视了差异信息。我们提出的DIIM通过修改了Crossattention，提取了差异信息。之前的Pixel损失要么使用了最...

【红外与可见光图像融合】STFNet: Self-Supervised Transformer for Infrared and Visible Image Fusion

IEEETRANSACTIONSONEMERGINGTOPICSINCOMPUTATIONALINTELLIGENCE 代码公开本文提到一些有意思的说法：我们假设融合数据集中只是存在轻微错位的图像对...

【红外与可见光图像融合】DATFusion：DATFuse: Infrared and Visible Image Fusion via Dual Attention Transformer

基于CNN和transformer，空间和通道注意力。对比了两个基于transformer的方法，SwinFusion通用融合框架和一个2022年还没中稿的arxiv的一片PPTFusion。代码...

【红外与可见光图像融合】BTSFusion: Fusion of infrared and visible image via a mechanism of balancing texture and

我们将两种传统方法——引导滤波器GF和潜在低秩表示LatLRR的优越方面结合起来，提出了一种平衡纹理和显著性的红外和可见光图像融合方法。作者也说了，本文复杂的地方就在于损失函数的设计。引入GF和La...

【红外与可见光图像融合】DSMGN: Dual-Supervised Mask Generation Network for Infrared and Visible Image Fusion

VIS除了用于细节特征提取还做了什么？用于初步融合图像，这里的融合我理解为在图像级别的融合，而不是在特征级别。backbone部分知识学习到了一个IR的权重图M1，VIS保留程度就是1M1。马JY...

A practical infrared and visible image fusion network based on progressive ..._译文

目录摘要 1.简介 2.相关工作 2.1.红外与可见光图像融合 2.1.1面向视觉感知的图像融合 2.1.2.语义驱动的图像融合 2.2.语义分割 2.2.1单模态语义分割 2.2.2.多模态语义分...

An infrared and visible image fusion algorithm based on ResNet‑152

AninfraredandvisibleimagefusionalgorithmbasedonResNet‑152 学习笔记文章日期2021.9 摘要：经过红外线和可见光融合的图像可以同时包含隐藏对...

是否确定退出登录?

【红外与可见光图像融合】Infrared and visible image fusion based on a two-stage class conditioned auto-encoder ne

第一阶段训练：

没有融合层，初始化类嵌入向量

消融实验：

典型主观图

全部评论 (0)

相关文章推荐

【红外与可见光图像融合】Infrared and visible image fusion based on a two-stage class conditioned auto-encoder ne

【红外与可见光图像融合】GuideFuse: A Novel Guided Auto-Encoder Fusion Network for Infrared and Visible Images

【红外与可见光图像融合】Semantic perceptive infrared and visible image fusion Transformer

【红外与可见光图像融合】Rethinking Cross-Attention for Infrared and Visible Image Fusion

【红外与可见光图像融合】STFNet: Self-Supervised Transformer for Infrared and Visible Image Fusion

【红外与可见光图像融合】DATFusion：DATFuse: Infrared and Visible Image Fusion via Dual Attention Transformer

【红外与可见光图像融合】BTSFusion: Fusion of infrared and visible image via a mechanism of balancing texture and

【红外与可见光图像融合】DSMGN: Dual-Supervised Mask Generation Network for Infrared and Visible Image Fusion

A practical infrared and visible image fusion network based on progressive ..._译文

An infrared and visible image fusion algorithm based on ResNet‑152