(脑肿瘤分割笔记-PartTwo)一种高效的脑肿瘤三维分割嵌入网络
目录
Title:Efficient embedding network for 3D brain tumor Segmentation
摘要
方法
编码器分支
解码器分支
损失函数
总结
Title:Efficient embedding network for 3D brain tumor Segmentation
摘要
在本研究中,我们开发了一种二维分类网络性能转移方法,旨在实现对脑肿瘤进行三维语义分割,并提出了一个非对称结构设计的UNet网络,其中作为编码分支的重要组成部分,将EfficientNet模型融入其中。值得注意的是,由于输入数据具有三维特征,我们特别关注于缩减第一层卷积操作所处理的空间维度,从而确保与EfficientNet模型兼容。
从整体来看, 本文提出了一种高效的方法, 在不丧失三维一致性的情况下实现了任意二维分类体系向三维分割目标的转换. 这种思想具有良好的扩展性, 在将其整合到另一个高维体系时能够保持空间一致性.
方法
该文所提出的方案采用了卷积编码器与解码器的架构。这种方案由一个非对称的大编码器负责提取图像特征,并通过一个小规模的解码器来重建分割掩膜。研究者在编码器分支中插入了本研究提出的一种名为EfficientNet的新网络模型。
编码器分支
编码流程包含两个阶段,在第一阶段中将三维空间数据转换为二维图像,并维持原始的空间维度。随后将三维空间数据仅减少深度到三个通道。当数据完成第一步编码后,在第二阶段采用一种改进型网络结构进行处理。该方法的具体架构图如下所示:

如图所示,其输入是一个一维裁剪的3D MRI图像。片间编码器和解码器都由规范的残差块构成。解码器的输出包括三个通道,并与输入通道的空间尺寸保持一致,在每个EfficientNet模块中展示了相应的输出维度。
如图1所示,在EfficientNet中采用块状表示法与原始版本相同。然而,在跳转连接层中仅表示涉及其中的部分块。片间编码部分则采用卷积块进行处理:每个卷积块由两个卷积层组成,并分别施加归一化处理后引入ReLU激活函数。在基于自动编码器正则化的三维MRI脑肿瘤分割研究之后,默认采用组归一化技术:将通道划分为若干组,并基于每组通道计算均值和方差进行归一化操作。该方法相较于传统的批处理规范化显示出更好的性能表现,在批量大小较小的情况下尤为突出。

解码器分支
在编码架构中不对称,在解码阶段采用了均匀类型的块构建整个系统结构,并如图所示进行了模块划分。值得注意的是其对应的二维(2D)解码模块负责处理这一部分而三维(3D)架构则用于片间连接。随后,在每个层级中先对空间维度进行上采样操作将特征数量乘以二倍之后再进行跨层连接操作。为了确保输出的有效性我们采用sigmoid函数作为激活函数并最终得到三个通道分别对应于与输入具有相同空间大小的类的数量
损失函数
许多先前的研究都基于交叉熵损失函数进行训练。然而这些网络在结果的表现可能并非最佳的理想dice得分。本文采用了软Dice损失函数作为改进型损失函数来训练所提出的方法。该方法被称为软Dice损失函数并且其具体的数学表达式如下所示:

其中Ptrue和Ppred分别代表ground truth标签与预测标签。在脑MRI分割这一领域中存在诸多具有挑战性的问题,在训练过程中仅依赖固定损失函数、交叉熵或dice难以取得理想效果。其主要原因与数据严重失衡有关,在实际应用中通常会采用两种损失函数的加权融合方式作为优化目标,在实际应用中最终采用以下形式:
L=Lcross-Ldice
总结
文中所述,在本研究中提出了一种通用的3D-UNet架构。该框架通过整合任意二维分类网络来实现性能传递。具体而言,在模型设计中采用分步策略:首先构建编码器与解码器均分为两个主要组成部分,并经深度压缩阶段处理后将原始三维特征转化为二维特征表示。这一过程作为一个连续的整体流程,在此过程中三维卷积层与最大值池化操作仅缩减第三维的空间维度。随后经任何二维分类网络可进一步编码处理后再进入二维解码环节后再进行三维重建步骤。
