Advertisement

【BAN】A New Learning Paradigm for FoundationModel-based Remote Sensing Change Detection

阅读量:

这篇论文提出了一种基于通用基础模型的适应变化检测(CD)框架,称为BAN框架。该框架旨在利用大型基础模型的通用知识,减少现有CD模型对标记数据的依赖。通过引入桥接模块和Bi-TAB模块,BAN框架能够将通用特征与特定任务特征有效融合。实验结果表明,BAN框架只需少量可学习参数即可显著提升现有CD方法的性能,证明了基础模型在适应CD任务中的可行性。该框架具有高度可扩展性,可受益于更强大的基础模型,为后续研究提供了新方向。

change detection

变化检测系列论文专栏

change detection

目录

🌷🌷简介

题目:一种基础模型遥感变化检测的新学习范式

论文:paper

代码:code

🍇🍇1.摘要

🍋🍋2.创新点

🍓🍓3.网络结构

🍭3.1模型框架

🍭3.2网络结构

基础模型提取

Bi-TAB

桥接结构

🍭3.3BAN框架伪代码

🍭3.4损失函数

🍂🍂4.实验结果

🏆4.1LEVIR-CD数据集可视化结果

🏆4.2LEVIR-CD数据集精度对比

🏆4.3BANDON数据集可视化对比

🏆4.4S2LOOKING数据集精度对比

🏆4.5BAN框架与其他CD方法对比

🏆4.6LANDSAT-SCD数据集对比

🏆4.7BANDON数据集对比

🏆4.8WHU-CD数据集上BAN与其他孪生监督CD网络对比

🏆4.9参数选择实验

🌷🌷5.启发

整理不易,欢迎一键三连!!!

送你们一条美丽的--分割线--


改写说明

🌷🌷简介

题目:一种基础模型遥感变化检测的新学习范式

论文:paper

代码:

复制代码
(https://github.com/likyoo/BAN "code")

* * *

## 🍇🍇1.摘要

>
>
> 变化检测(CD)是一项观察并分析土地覆盖的动态过程的关键任务。 虽然大量基于深度学习的CD模型表现出色,但是他们的**性能改进** 受到以下因素的限制:**从给定的标记数据中提取的知识是有限的** 。 另一方面,最近出现了一些包含**通过跨数据模式扩展获得大量知识和代理任务** 的基础模型。 在本文中,我们提出了一种 **Bi-Temporal Adapter Network (BAN)** ,这是一个基于通用基础模型的旨在提取基础模型的CD适应知识法人网络框架,**BAN** 主要包含三个内容:**冻结基础模型** (例如 CLIP)、**双时态适配器分支** (Bi-TAB),以及它们之间的**桥接模块** 。  
>  **Bi-TAB** 可以是现有的任意CD模型或一些手工制作的堆叠块。**桥接模块** 的设计旨在使一般功能与特定任务/领域的功能的通用模块知识注入 Bi-TAB模块。 据我们所知,这是第一个使基础模型适应 CD 任务的通用框架。
>
>
>
> **大量实验** 证明了我们的 BAN 的有效性,提高了现有 CD 方法的性能(例如,只需要一些额外的可学习的参数,提升 4.08% IoU )。 更重要的是,这些成功的实践揭示了遥感 CD 基础模型的潜力。
>
>

##  🍋🍋2.创新点

  * 提出了一种**通用框架(BAN)使基础模型适应CD任务** ,有效地重复使用了基础模型的一般知识,并将其转移到 CD 任务中,此外,作为一个侧面调整框架,BAN 允许有效**调整参数,内存和时间**
  * 为了更好的**将一般特征与特定领域/任务的特征进行融合** ,提出了**桥接模块** ,经过跨领域点积注意力,桥接模块可以对通用知识进行重采样,然后将其转化成注入遥感CD领域的特征
  * **Bi-TAB模块** 作为与模型无关的概念被提出,它可以是现有的CD模型或手工设计的堆叠块,得益于其**即插即用** 的特性,使得BAN几乎可以适配现有的任务CD模型。

## 🍓🍓3.网络结构

### 🍭3.1模型框架
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/nMT1iexvtyIsEZjNudYDGzfChwLA.png)

从图1 中能明显看出,BAN框架的结构:通用基础模型、桥接模块和Bi-TAB。此外通用基础模型的参数是冻结的,其他两个模块的参数是可学习的。

### 🍭3.2网络结构
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/7Wq8YysZg3Pl4EcMmJXxUdjCGkBh.png)

可以看到,图2中的两张输入影像分别作为图1中框架的输入进行完整2次,类似于孪生网络的结构。其中:

####  基础模型提取

作为冻结层,其参数是不变的,因此对于两张输入影像来说,是参数共享的骨干网络提取模块,可以同时进行;

####  Bi-TAB

由于基础模型部分被冻结,因能从图像中提取通用信息,这些通用信息不完整,不足以作为为CD任务的输入特征,因此需要Bi-TAB模块这种专门针对特定领域/任务的特征提取模块,虽然其没有指定为某种具体的网络,但是可以指定其为任务现有的CD网络,比如基于CNN和Transformer的模型。如下图3所示的,分别将BiT和ChangeFormer作为Bi-TAB模型。
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/jylYrI59zDpWU2FthukZvNK7oa13.png)

####  桥接结构

桥接结构的提出主要是解决2个问题:第一个问题,并非所有的通用特征都是需要的,如何从通用特征中过滤无用信息,选择有价值的信息;第二个问题是通过patch embedding之后具体极低的分辨率,如何对齐两个来源的特征是桥接结构的主要任务。

桥接结构的做法是:针对框架中的两种类型输入:基础模型特征![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/GK2tSCT7gBDozb1pFZxmRUMOrvfs.png)和 特定任务特征![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/mFhoADcH2NVPSeuUOEJGn1faT0Yi.png),为避免分布不一致的情况,首先使用LN层进行标准化,再使用线性层进行投影。
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/1ajeWhsDiPKZcdmN6tQUFH953CS0.png)

为了有效地区分通用模型中有价值的特征,我们计算亲和力矩阵

A ∈R HcWc×HfWf

然后,通过计算注意力权重![\tilde{A}](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/5OhjCB3cUHga0sYfloMunAKDENVp.png),将注意力权重与输入通用特征进行点乘,得到过滤后的通用特征![\tilde{x}^{^{cm}}](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/IDieNyb83ucf9CL1p5ZQHOrVJKkv.png)
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/RFpP4Hn76cCtAYrKey90vMN2faVI.png)

在此过程中通用特征被重新采样为 Hc × Wc × Cc,这也解决了比例尺错位问题。具体的桥接结构比较简单,可以用一下公式表示:
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/F2oT5C9Mr6nIOaXcSdwGQ1YLKWBE.png)

### 🍭3.3BAN框架伪代码
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/nM7HrfADa8smiXQvO31FcBgG4Elu.png)

### 🍭3.4[损失函数]()

损失函数使用常用的CEloss,计算方式如下:
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/WPBr8RVwexGJHn0cCNlQIpzFO9gy.png)

## 🍂🍂4.实验结果

### 🏆4.1LEVIR-CD数据集可视化结果
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/CkoOh2iFYDaWSBcH9pbe67EfAGvx.png)
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/GpCNTaxD1oSVfJmyEIwOLURP5KdA.png)
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/jTFUXodpIxwB9Q1yfauJg2qnGbOv.png)

### 🏆4.2LEVIR-CD数据集精度对比
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/zyWmBIvXONgn75eZbRQ6SUcwf089.png)

### 🏆4.3BANDON数据集可视化对比
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/2L1ngcFhZeVPOHSsl8ADzQTpI5yq.png)
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/GLscPBRTQaWkb93XwrnAY2V6H8qN.png)
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/yQaVFIDfsBipJvObPRwWG7SMTtm4.png)

### 🏆4.4S2LOOKING数据集精度对比
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/cUSyaBd1lvD48bCLM7PV5grsetGn.png)

### 🏆4.5BAN框架与其他CD方法对比
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/QRImFSdvurzU2BXV1ZljPJTKoH9Y.png)

### 🏆4.6LANDSAT-SCD数据集对比
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/M3tz6uL4hFHymZYlqpsWXB20nNgS.png)

### 🏆4.7BANDON数据集对比
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/NSQmn1uaqW9Lg6p3KAefF7tyT8EB.png)

### 🏆4.8WHU-CD数据集上BAN与其他孪生监督CD网络对比
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/ONloAdy0Qi3YhHvznJqw6MKRIWZV.png)

### 🏆4.9参数选择实验
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/gpto3isYkONHqbX7eMPWnrU8Gc4j.png)
![](https://ad.itadn.com/c/weblog/blog-img/images/2024-12-10/4viJybf9YUGResP5zQgnEuhCwlZp.png)

## 🌷🌷5.启发

>
>
> 本文提出了一个**通用框架** (即 BAN),利用大型基础模型的常识,**减少** 现有 CD 模型对**大型标记数据量的依赖** 。 实验结果表明**只需几个额外的可学习参数** ,BAN 就可以有效**提升现有CD方法的性能** ,并使他们能够从更少的样本中更好地学习。
>
>
>
> BAN 中的**基础模型和 Bi-TAB** 都是**模型无关** 的,BAN 具有高度可扩展性,可以受益于更强大的基础模型,从而有助于提升现有CD模型。 更重要的是,**BAN 证实了 CD 任务中基础模型适应的可行性** ,为后续研究提供了研究基础。
>
>

## **整理不易,欢迎一键三连!!!**

## **送你们一条美丽的--分割线--**

🌷🌷🍀🍀🌾🌾🍓🍓🍂🍂🙋🙋🐸🐸🙋🙋💖💖🍌🍌🔔🔔🍉🍉🍭🍭🍋🍋🍇🍇🏆🏆📸📸⛵⛵⭐⭐🍎🍎👍👍🌷🌷

全部评论 (0)

还没有任何评论哟~