Advertisement

深度学习图像分割概述

阅读量:

FCN

图像语义分割技术的起始阶段已正式拉开序幕。
采用卷积层取代全连接层的方式不仅灵活适应输入尺寸的变化,并能保持输出与输入在空间维度上的一致性。
池化操作扩大了感受野范围的同时降低了输出的空间分辨率;上采样过程则通过反卷积或插值方法提升图像的空间细节。
在此过程中我们采用了跳跃式设计以逐步利用浅层特征辅助上采样过程 但这种做法不可避免地带来了信息丢失的风险 因此分割结果的精细程度仍有待提高。
为了提升模型性能 我们采用了两种不同的改进方案 即UNet架构和空洞卷积设计。
在计算感受野时 默认情况下未考虑填充层的影响 因此其计算范围完全基于原始输入数据。

在这里插入图片描述

空洞卷积

在这里插入图片描述
在这里插入图片描述

在传统的卷积结构中引入了dilation rate参数。
我们可以认为原始图像经过每隔(dilation_rate - 1)个像素取样处理;
同时,在这一层面上来看,
我们可以认为原始图像经过每隔(dilation_rate - 1)个像素取样处理。
另一方面,
我们可以认为原始图像经过每隔(dilation_rate - 1)个像素取样处理。
在这种情况下,
滤波器的空间扩展程度也随之增加。
具体而言,
经过计算可得扩张后的滤波器尺寸满足如下关系式:
kernel_size_after_dilate = (dilate_rate - 1)*(kernel_size_before_dilate - 1)+ kernel_size_before_dilate
这种改进方法的主要缺陷在于会导致图像信息连续性的丢失以及出现栅格效应(The Gridding Effect);
此外,
对于较小物体的分割效果也会有所下降。

HDC (Hybrid Dilated Vonvolution)

是一种对空洞卷积的优化方法。该方法主要包含以下三方面的改进:首先,在dilated rate的设计中必须避免公约数超过1的情况(例如像[2,4,6]这样的配置)会导致栅格效应的问题出现;其次,在具体实现过程中采用了锯齿状排列的方式(如周期性重复出现[1,2,5])以避免上述问题;最后,在设计过程中必须严格遵循以下条件:

在这里插入图片描述

一个简单的例子: dilation rate [1, 2, 5] with 3 x 3 kernel (可行的方案)

在这里插入图片描述

而这种形状具备良好的特性,并且能够同时满足对小尺寸和大尺寸物体的分割需求(通过较小的膨胀率关注近距离的信息,并通过较大的膨胀率关注远处的信息)

全部评论 (0)

还没有任何评论哟~