Advertisement

DeepLab-v3+:Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation

阅读量:

编码器-解码器架构基于空洞可分离卷积用于语义图像分割

目前的问题:

简述:
该文所提出的模型DeepLabv3+是对DeepLabv3的一种拓展:

  1. 该文提出了一种创新性的编码解码架构。这种架构将 DeepLabv3 作为的强大编码模块与高效的解码组件相结合。
  2. 在 DeepLabv3+ 中可通过灵活运用卷积操作任意调节编码层特征图的空间分辨率,在精确度与运行速度之间实现了良好的权衡,在现有编解码架构中此功能尚不存在。
  3. 该研究将 Xception 模型应用于分割任务的核心环节,并巧妙地将深度可分卷积技术分别应用于 ASPP 模块以及编译阶段中的 decoder 部署端口设计上,在性能效能方面实现了显著提升。

方法:
1.具有洞卷积的编码器-解码器
1.1 洞卷积

参考了DeepLab-v2算法的基础上进行了优化。1.2 深度可分离卷积
该方法采用深度可分离卷积技术,在保证性能的前提下显著降低了计算复杂度,并减少了计算量。深度可分离卷积将标准卷积分解为深度卷积(Depthwise conv)和逐点卷积(Pointwise conv),从而实现了高效的特征提取。具体而言,在标准卷积分解过程中,深度卷积操作对输入通道独立执行空间滤波操作,而逐点卷积则结合了深度滤波后的输出信息。在本文中,我们采用了基于洞的深度可分离卷积结构,在不显著影响模型性能的前提下实现了计算复杂度的大幅降低和运算速度的提升。

在这里插入图片描述

1.3 DeepLabv3作为编码器
1.4目标解码器

在这里插入图片描述

可以看到,在本文中提出了一种名为DeepLabv3+的新框架。该框架基于编码器-解码器架构实现了对DeepLabv3的有效扩展。其中的编码器模块通过多尺度应用空洞卷积来捕获多尺度的上下文信息特征,并且相对简单的解码模块即可生成目标边界细化分割输出。这种设计既能确保分割效果与边缘完整性的同时还显著降低了计算复杂度

2.修改后的Xception
当前Xception网络已被提出并不断优化,在本文的基础上对其进行改进:
(1)对其原有的网络架构进行深化拓展,(2)将所有的max pooling替换为深度可分离卷积操作,(3)在每经过3×3深度c之后插入额外批归一化层并添加ReLU激活函数

在这里插入图片描述

实验部分

在这里插入图片描述

改变解码器的结构进行试验:

在这里插入图片描述

训练阶段使用指定输出分辨率:OS;验证阶段同样采用该参数:OS;解码器部分基于所设计的新架构实现:Decoder;多尺度特征融合用于评估过程:MS;通过左右翻转引入额外数据增强:Flip

在这里插入图片描述

ImageNet-1K验证集的单模型错误率:

在这里插入图片描述

试验结构(最后一行为失败结构):

在这里插入图片描述

全部评论 (0)

还没有任何评论哟~