论文笔记：Progressive Semantic Segmentation

阅读量：

文章目录

论文题目：Progressive Semantic Segmentation（渐进式语义分割）
1.介绍
2.MagNet
- 2.1Multi-stage processing pipeline
- 2.2Refifinement module
- 2.3MagNet-Fast
3.实验
- 3.1 在Cityscapes dataset的实验
- 3.2 在DeepGlobe dataset的实验
- 3.3 在Gleason dataset的实验

论文题目：Progressive Semantic Segmentation（渐进式语义分割）

四个问题

要解决什么问题？

对高分辨率的图像，但是不能使GPU内存超载或丢失输出的分割图中的精细细节。

问题提出的动机

a.内存的限制意味着必须对高分辨率的图像进行降采样，这种方法的弊端会造成丢失细节；
b.将图像分成局部patches进行单独处理，这种方法由于缺乏全局图，可能会产生歧义。

提出了什么新的方法？

这篇文章提出了MagNet，一个多尺度的框架，通过在多个放大级别上观察图像来解决局部的模糊性。MagNet有多个处理阶段，其中每个阶段对应于一个放大级别，而一个阶段的输出被送入下一个阶段，进行粗到细的信息传播。每一阶段都以比前一阶段更高的分辨率分析图像，恢复先前由于降采样步骤而丢失的细节，并且分割输出通过各处理阶段逐步完善。

效果如何？
在 urban views, aerial scenes, and medical images的三个高分辨率数据集上进行的实验表明，MagNet的性能始终优于其他方法。

1.介绍

目前最先进的语义图像分割技术是基于深度学习，其中一个卷积神经网络（CNN）接受一个输入图像并输出一个分割图。然而，现有的大多数技术都假定整个分割过程可以通过对输入图像的单一前馈传递来完成，并且整个过程可以装入GPU内存 。遗憾的是，由于内存和其他计算限制，大多数现有技术无法处理高分辨率的输入图像。目前处理大型图像的方法有以下两种。
a.图像进行降采样；
b.将图像分成局部patches进行单独处理。
前一种方法会造成细节丢失，后一种方法由于缺乏全局图，可能会产生歧义。

解决上述两种方法的局限性的一种方法是将它们结合起来，即融合全局和局部分割过程 。一方面，整个图像的全局视图可以用来解决局部patches外观的模糊性。另一方面通过分析局部patches，可以细化分割边界并恢复由于全局分割过程中的降采样过程而丢失的细节。由于全局和局部比例之间有着巨大差距，很难完成。

本文从两者之间的多个尺度出发，引入了一个新的多尺度框架，这个框架可以整合全局背景线索来产生更精确的分割，并且它可以在内存限制下输出高分辨率的详细分割图。

2.MagNet

MagNet是一个多阶段的网络结构，网络的每一个阶段都对应着一个特定的尺度。
框架的核心是一个分割模块和一个细化模块，在每个阶段，细化模块的输入是两个分割图：前一阶段的累积结果和通过在当前比例下运行分割模块得到的结果。细化模块的目标是使用后一个分割图来细化前一个分割图。细化的位置是根据两个估计的分割图的不确定性确定的。只要它能输出带有不确定性估计的分割图，分割模块可以是任何分割骨干。细化模块与分割骨干无关；它可以用一个骨干进行训练，并在一个骨干上使用。

2.1Multi-stage processing pipeline

MagNet的结构和处理管道如下图所示：
在这里插入图片描述
在每一层，都有一个分割模块和一个细化模块。每一层的工作流程

1. 提取由窗口p定义的图像patch Xsp和先前的分割输出Yps-1。这些张量的高度和宽度是hs和ws。
2. 对Xsp和Yps-1进行降采样，使新的高度和宽度为h和w，这是可以装入GPU内存并被分割和细化模块处理的大小。让¯Xsp和Y¯s-1p表示降采样的张量。
3. 以¯Xsp为输入，使用分割模块获得特定尺度的分割图¯Osp。
4. 以Y¯ s-1 p和¯Osp为输入，使用细化模块对Y¯ s-1 p进行细化。得到Y¯ sp。
5. 对Y¯ sp进行上采样，得到大小为hs×ws×C的Yps。

2.2Refifinement module

细化模块的工作流程如下图所示：
在这里插入图片描述
它被用来在每个处理阶段完善分割图的单个patch。管道的每个处理阶段对分割图的各个斑块进行细化。该模块的输入是两个大小为h×w×C的分割图：来自以前所有比例的累积分割图Y和来自当前比例的比例特定分割图O。该模块的输出是更新的标度累积分割图。
它包含以下步骤。

1. 使用一个小型网络，以Y和O作为输入，我们得到一个初始的组合分割图R。
2. 计算预测不确定性图。具体来说，对于Y的每个像素，在这个位置的预测置信度被定义为最高概率值与第二高概率值之间的绝对差值（在C类的C个概率值中）。
3. 根据置信度得分计算出不确定性得分，使这两个分数必须加起来为1。
4. 同样地，我们可以计算R的预测不确定性图。Yu和Ru表示Y和R的不确定性图。
5. 接下来，我们将描述如何使用两个不确定性地图来选择Y的k个位置进行细化。用于对像素进行排名的分数图的计算方法是为Q = F(Y u. (1 − Ru ))，F表示中值模糊来平滑分数图。

2.3MagNet-Fast

框架在准确性和运行效率之间存在着权衡。减少运行时间的一个方法是减少要处理的尺度的数量。另一种方法是在每个尺度级别的图像patches的子集上进行分割和细化
MagNet-Fast结合了这两种方法，当它在较少的尺度上运行时，并且只选择预测不确定性最高的斑块Yu进行细化。此外，MagNet-Fast可以利用全局信息和细节信息进行分割，从而获得更好的结果。

3.实验

数据集：城市景观、航空场景和医疗图像
在这里插入图片描述
评估指标：mIoU

3.1 在Cityscapes dataset的实验

1.多个尺度层次的好处
在这里插入图片描述
上图显示了不同数量尺度的MagNet的结果。在最小尺度和最大尺度之间增加两个中间尺度则性能提高了4.34% mIoU。
2.多个分割方法的比较

可以看出，不管是MagNet-Fast还是MagNet，其mIoU都是领先其他方法的。
在这里插入图片描述
mIoU分布情况如上图所示。在MagNet和其他方法之间存在着很大的差距。特别是当观察放大的窗口时，差距很大。
3.Ablation study: 选点

初始分割的mIoU为63.23%。该框架在使用Yu和(1-Ru)的平滑操作时，框架取得了最佳性能。

3.2 在DeepGlobe dataset的实验

在这里插入图片描述
在DeepGlobe dataset的实验中使用FPN作为分割方法。backboneMagNet和MagNet-Fast的表现都优于其他方法。

3.3 在Gleason dataset的实验

在这里插入图片描述
在Geason dataset的实验中使用PSPNet作为backbone。MagNet与PSPNet的分割骨架一起运行，它将PSPNet的性能提高了1.7%。优于其他方法。

全部评论 (0)

还没有任何评论哟~

论文笔记：Progressive Semantic Segmentation

文章目录论文题目：ProgressiveSemanticSegmentation（渐进式语义分割） 1.介绍 2.MagNet 2.1Multistageprocessingpipeline 2.2...

《Understanding Convolution for Semantic Segmentation》论文笔记

论文地址：<https://arxiv.org/pdf/1702.08502.pdf 源码：<https://github.com/TuSimple/TuSimpleDUC What:《Underst...

《Context Encoding for Semantic Segmentation》论文笔记

参考代码：PyTorchEncoding 1\.概述导读：在这篇文章中研究了CNN特征图的全局上下文信息对于分割的影响，文章指出像之前工作中通过增加CNN网络层数感受野或者使用膨胀卷积，那么这样就能...

《Decoders Matter for Semantic Segmentation》论文笔记

参考代码：DUpsampling 1\.概述导读：目前流行的语义分割网络架构都是编解码结构的，往往在解码器的最后是添加一个upsampling（图像的双线性插值）实现decoder输出与训练标注的尺...

《Semantic Segmentation using Adversarial Networks》论文笔记

论文地址：<https://arxiv.org/pdf/1611.08408.pdf 论文地址：pytorchtensorflow tensorflow并不是作者提供的源码，网上分享的，据说Discr...

[论文笔记] Context Encoding for Semantic Segmentation

CVPR2018ORAL 2018年3月，作者单位：RutgersUniversity 作者博客 EncNetcvpr2018slides 源码图1.EncNet网络结构图贡献1、ContextE...

《BiSeNet：Bilateral Segmentation Network for Real-time Semantic Segmentation》论文笔记

代码地址：BiSeNet 1\.概述导读：这篇文章是Face++推出实时语义分割算法，文章指出语义分割是同时需要丰富的空间信息以及大量的感受野的。然而，现有的方法通常是在空间分辨率上取折中去获得实时...

论文笔记：Fully Convolutional Networks for Semantic Segmentation

摘要卷积网络是产生特征层次结构的强大视觉模型。我们展示了卷积网络本身，经过端到端、像素到像素的训练，超过了语义分割的最新技术水平。我们的主要见解是构建“全卷积”网络，该网络接受任意大小的输入并通过有...

【论文笔记】Learning Deconvolution Network for Semantic Segmentation

LearningDeconvolutionNetworkforSemanticSegmentation 首先介绍了基于FCN的语义分割，如论文： 1.FullyConvolutionalNetwork...

《Learning Deconvolution Network for Semantic Segmentation》论文笔记

注：文章仅是对自己学习的记录，非专业评论 what：文章讲了一个反卷积用于语义分割的模型，这个模型也属于一个encoderdecoder模型，与大多数类似的模型一样，传承了FCN的思想，编码网络沿用了...

是否确定退出登录?

论文笔记：Progressive Semantic Segmentation

文章目录

论文题目：Progressive Semantic Segmentation（渐进式语义分割）

1.介绍

2.MagNet

2.1Multi-stage processing pipeline

2.2Refifinement module

2.3MagNet-Fast

3.实验

3.1 在Cityscapes dataset的实验

3.2 在DeepGlobe dataset的实验

3.3 在Gleason dataset的实验

全部评论 (0)

相关文章推荐

论文笔记：Progressive Semantic Segmentation

《Understanding Convolution for Semantic Segmentation》论文笔记

《Context Encoding for Semantic Segmentation》论文笔记

《Decoders Matter for Semantic Segmentation》论文笔记

《Semantic Segmentation using Adversarial Networks》论文笔记

[论文笔记] Context Encoding for Semantic Segmentation

《BiSeNet：Bilateral Segmentation Network for Real-time Semantic Segmentation》论文笔记

论文笔记：Fully Convolutional Networks for Semantic Segmentation

【论文笔记】Learning Deconvolution Network for Semantic Segmentation

《Learning Deconvolution Network for Semantic Segmentation》论文笔记