Multi-Scale Context Aggregation by Dilated Convolutions 总结
发布时间
阅读量:
阅读量
摘要
基于图像分割任务中对像素级别的精细定位需求,在此基础上设计了一种新型卷积网络模块。膨胀式卷积 通过有效地整合多尺度特征信息而成功保留了细节信息。膨胀式卷积能够显著扩大感知范围。
前言
近年来,有两种处理多尺度推理和全分辨率密集预测的方法:
- 通过不断在各个层级反复应用up-convolutions(上卷积)的技术来恢复丢失的分辨率。
- 利用多幅重新采样的图像作为网络输入,并整合这些预测结果。
扩张的卷积
既然加入池化层会导致信息丢失并降低模型的精度,在这种情况下如果不加入池化层,则卷积的感受野会减小从而无法捕获全局特征。因此移除池化层后反而可能导致计算开销剧增单纯地增大卷积核尺寸可能会带来计算负担的激增这时空洞卷积作为一种有效的解决方案就显得尤为重要
如图:

图a,传统的卷积网络,接收域是3x3
图b中使用的是基于2D膨胀卷积(dilated convolution)生成的空间扩展核(expansion kernel),其覆盖区域大小为7×7;图c中则采用基于4D膨胀卷积生成的空间扩展核(expansion kernel),其覆盖区域大小为15×15;可以看出,在F_{i+1}序列中每一个元素的空间扩展范围尺寸均为(2{i+2}-1)(2{i+2}-1)。
同时,在卷积运算中实际参与的因子数量未发生变化的情况下
结构

网络结构
在Layer方面可以看出总共有8层,在前七层卷积核的尺寸为3×3,在最后一层卷积核的尺寸则缩减至1×1。由于空洞卷积会使图像尺寸有所扩大,在此情况下我们采取了边缘剪裁措施以保证各层间的有效通信。值得注意的是,在处理这一问题时我们采用了渐进式的设计方法:即从小区域的感知开始逐步过渡到整体特征的捕捉。具体而言就是从局部区域内的细节感知开始积累特征信息,并通过不断扩展的方式将这些特征分配到更大的区域内以实现全局性的特征表达。
问题
- 由于空位操作导致卷积核断裂,并失去了空间信息
- 尽管通过膨胀操作能够扩大观察范围,并且能捕捉到远处的目标特征;但这种策略会阻碍了对精细目标(如小物体)的分割能力。
全部评论 (0)
还没有任何评论哟~
