【论文阅读二】:EFFICIENT SYMMETRY-DRIVEN FULLY CONVOLUTIONAL NETWORK FOR MULTIMODAL BRAIN TUMOR SEGMENTATIO
论文详细阐述了以一种 Variant FCN 方法实现对 brain tumors 的自动分割。
二、基础知识
FCN
VGG16
三、开始表演
目的:大脑肿瘤分割
那么什么是大脑肿瘤分割?为什么要进行大脑肿瘤分割?

上图展示了四种MRI模态下HG gliomas患者的脑肿瘤图像(绿色为水肿区域),最后一个图是由专家绘制的肿瘤边界轮廓(红为坏死区、黄为增强区、蓝为非增强区)。
我的观点是:明确肿瘤结构对治疗至关重要,并且精确划分肿瘤边界对治疗至关重要。
文中提到准确分割脑肿瘤对医学治疗大有裨益(但朋友告诉我,在实际手术中通常不会进行如此细致的分类——最重要的就是确定边界在哪里!MRI成像仅能作为参考,在具体操作中还需要根据具体情况灵活运用——我对此感到疑惑:为什么非要研究这些细分区域呢?直接把焦点放在边界划分上不就好了?啊啊啊!望解答!)
网络架构:

该论文中展示了FCN架构图。该网络包含两个功能模块:一个负责图像特征提取的下采样分支(由卷积层和最大池化层构成),以及三个并行负责特征重建的上采样分支(每个分支包含反向扩散和平移卷积操作)。在具体实现过程中:
- 下采样的目的是通过扩展感知域来捕获高阶抽象和上下文信息来检测肿瘤。
- 上采样的目标是恢复肿瘤边缘等细节特征。为了实现这一目标,在网络架构中采用了层次式设计以利用下采样模块生成的多尺度特征矩阵。
详解下采样 :我们只有一个下采样路径,就是上图中横着的那一条路。这个下采样路径类似于VGG16模型,它就是VGG16的前三层。三个卷积块和二个最大池化层,每个卷积块中有两到三个卷积层,fliter的大小都是3x3,最大池化层的尺寸都是2x2
作者详述了为什么只采用VGG前三层,而不加深卷积层:
(1)医学图像与自然图像不同,自然图像有丰富的高级别语义特征,而医学图像大多都是基于低级别的纹理特征。即使神经网络再深也不会对医学图像有所帮组,因为从医疗图像中学到的高级别特征信息是有限的。
(2)在医疗图像中,病变相对于整张对象来说比较小,加深卷积层可能会导致小的病变消失在后面的卷积块中,因为通过最大池化层,每一个块都会相应的缩小图像的尺寸。
(3)更深的卷积层操作会带来更多的参数,这很可能导致过拟合
详解上采样 :我们只是简单的将每一个卷积块(卷积块被黄色的箭头分割)的最后一个卷积层的feature map进行上采样到原始空间大小,另外三个卷积层用来encode不同尺寸的特征表示。在进入最终分类器之前,三个上采样路径的feature map被联系在一起。
注:并没有使用反卷积来进行上采样,因为它同样会带来更多的参数,从而可能导致过拟合。
在每一个卷积层后作者都使用了Relu来防止线性映射,以及采用batch normalization to reduce the internal-covariate-shift.(这个不怎么清楚是什么原理,作者在文中提到这个对于优化网络结构很重要,可以通过增大学习速率来加速训练过程,还可以避免局部最小)
输入 :各位小伙伴有没有注意到我们的输入是2D图像,而且是八张。这个2d图像来自于3d图像中的2d轴向切片,那也应该是我们图一中的四张图,那还有四张图呢?
还有四张图来源于对称图:因为肿瘤经常会破坏健康大脑的对称形态,所以轴对称对于大脑肿瘤分割而言非常有意义。在输入中,我们通过增加额外的对称图来将大脑对称信息encode进我们的CNN架构。
对称图产生过程我就不细述了。
其他的就是数据集的评估了。
