Advertisement

G-CASCADE: Efficient Cascaded Graph Convolutional Decoding for 2D Medical Image Segmentation

阅读量:
论文信息
  • 会议/期刊 : WACV 2024
  • 作者 : Md Mostafijur Rahman, Radu Marculescu
  • 单位 : The University of Texas at Austin
  • 代码开源 : GitHub链接
  • 核心任务 : 2D医学图像分割(涵盖腹部器官、心脏结构、息肉病灶等五大任务)

创新点

新型图卷积解码器架构 * 提出首个基于图卷积网络(GCN)的解码器 G-CASCADE ,通过图卷积保留全局感受野,缓解传统卷积解码器的长程依赖性缺失问题。
* 结合空间注意力模块(SPA),增强局部上下文信息的捕获能力。

高效计算设计 * 提出轻量级上采样卷积块(UCB) ,将3×3卷积替换为深度可分离卷积,减少82.3%的FLOPs和80.8%的参数量。
* 优化图卷积块(GCB) ,采用K近邻(K=11)和动态图构建策略,平衡计算效率与信息传递能力。

多阶段多分辨率特征融合 * 通过级联架构逐步融合不同层次特征图(X1至X4),联合优化多尺度预测结果,提升边界定位精度(HD95显著降低)。


摘要

G-CASCADE提出了一种高效的级联图卷积解码器,用于改进基于分层Transformer编码器的医学图像分割。其核心在于通过图卷积模块保留Transformer的全局信息,并通过空间注意力增强局部特征。实验表明,该方法在五个医学分割任务中优于现有方法(平均Dice提升0.22-2.2%),同时大幅降低计算成本(减少82.3% FLOPs和80.8%参数量),可无缝集成多类分层编码器(如PVTv2、MERIT)。


研究意义
  • 理论意义 : 首次将图卷积引入解码器设计,突破传统卷积的局部性限制,实现全局-局部信息的联合建模。

  • 应用价值 :

    • 支持低资源设备的实时医学图像分析(如MRI、CT、内镜影像)。
    • 在复杂解剖结构(如多器官分割和微小病灶定位)中表现优异,HD95表明边界分割精度显著提升。
  • 方法通用性 : 解码器可适配多种分层编码器(CNN/Transformer混合架构),扩展至一般语义分割任务(如遥感或自动驾驶)。


提出的方法

整体架构 * 编码器 : 采用PVTv2或MERIT等分层Transformer,提取多尺度特征。
* 解码器流程 :
* 上采样(UCB) : 深度可分离卷积升采样。
* 特征融合 : 将编码器各阶段特征(X1-X4)与解码器特征按级联结构融合(加法或拼接)。
* 图卷积注意力模块(GCAM) : 组合GCN和空间注意力(SPA),公式化表示为:
\text{GCAM}(x) = \text{SPA}(\text{GCB}(x))

复制代码
   * **分割头(SegHead)** : 轻量级1×1卷积生成预测图,多阶段结果加权融合(权重固定为1.0)。

核心模块设计 * GCB块 : 包含动态KNN图构建→图卷积(GELU激活)→通道标准化(BN)。
* SPA模块 : 融合通道最大值与平均值,通过7×7卷积强化局部上下文。

训练策略 * 多阶段损失聚合 : 组合交叉熵(30%)与Dice损失(70%)。
* 数据增强 : 随机翻转、旋转及多尺度训练(息肉任务输入352×352,多尺度缩放系数{0.75, 1.0, 1.25})。


关键实验结果
数据集 Dice (%) ↑ HD95 ↓ FLOPs (G) Params (M)
Synapse(MERIT-GCASCADE) 84.54 10.38 1.523 3.55
ACDC(MERIT-GCASCADE) 92.23 - - -
对比SOTA(CASCADE) 性能优0.38-0.5% 参量减少80.8% FLOPs减少82.3%

结论 :G-CASCADE通过图卷积与空间注意力的耦合设计,显著提升分割精度与效率,为医学图像分析提供了一种新范式。

全部评论 (0)

还没有任何评论哟~