基于深度卷积神经网络的超声图像乳腺肿瘤分类新方法(Springer会议(CBEB2018))
会议信息:
The Brazilian Congress on Biomedical Engineering (CBEB 2018) was hosted by the Brazilian Society of Biomedical Engineering (SBEB). The conference took place from October 21 to 25, 2018, in Armaçãode Buzios, Rio de Janeiro, Brazil.
An innovative approach to the categorization of mammary tumors within ultrasound imaging modalities was employed, leveraging the power of deep convolutional neural networks to enhance diagnostic accuracy and improve patient outcomes.
Bashir Zeimarani, M. G. F. Costa, Nilufar Z. Nurani, and Cicero F. F. Costa Filho
一、摘要
最近,深度学习在许多计算机视觉应用中显示出巨大的成功。学习图像特征并将这些特征用于目标定位、分类和分割的能力为新的医学图像研究铺平了道路,提高了自动计算机辅助检测(CADe)系统的性能。本文提出了一种基于卷积神经网络的超声图像乳腺肿瘤分类新方法。该数据库由641幅图像组成,组织病理学上分为两类(413个良性病变和228个恶性病变)。为了更好地估计模型的分类性能,数据被分割以进行五折交叉验证。对于每一折,80%的数据用于训练,20%用于评估。不同的评估指标被用作性能测量。利用所提出的网络架构,我们实现了肿瘤分类的86.12%的总体准确率,并且ROC曲线下的面积(AUC)等于0.934。在应用图像增强和正则化后,准确率和AUC分别提高到92.01%和0.9716。所得结果优于其他基于人工特征选择的机器学习方法,证明了该方法在超声成像肿瘤分类中的有效性。
关键词:乳腺肿瘤;超声图像;卷积神经网络
二、引言
乳腺癌是40岁以下女性癌症死亡的主要原因之一[1]。依据《2014年全球癌症报告》的数据统计显示:乳腺癌的发病率高达每百万人口中的43.4人(即43.4/100),占所有女性癌症病例总数的25.2%[2]。研究结果表明,在自1989年至2014年间,早期乳腺癌的诊断与合理治疗策略作为降低死亡率的关键因素之一发挥着重要作用[1]。其中数字乳腺摄影(DM)和超声(US)是最常用的两种技术[3]。然而尽管DM被认为是最有效的技术之一[3],但超声成像具有更加安全、通用且在密集区肿瘤探测上更具优势的特点[4]。与DM相比,在应用过程中超声系统严重依赖于放射科医师的专业判断能力,并且容易受到斑点噪声干扰以及操作者手部轻微晃动的影响等外界因素的影响。近年来,在医学影像分析领域中计算机辅助诊断技术取得了显著进展,并逐渐成为提高诊断效率和准确性的重要手段。特别是在图像分割、特征提取等方面展现了独特的优势,并成功地将这一工具作为辅助手段用于提高超声成像对操作员依赖性的最小化。
受机器学习在计算机视觉领域取得显著成效的推动下,
已有多方面的探索致力于构建基于超声US成像的乳腺肿瘤检测与分类的计算机辅助诊断系统。
其中,
文献[5]中,
研究者分别运用了三种梯度下降反向传播算法对超声成像中的乳腺肿瘤进行分类。
他们指出,
小波变换被用来实现图像降噪,并与自适应梯度下降方法结合以提高分类精度,
从而实现了该数据集的最佳性能。
文献[6]则采用了另一种思路:
构建了一个由临床专家手动筛选并打分生成特征矩阵,
并通过双聚类算法识别模式并结合反向传播神经网络进行肿瘤识别。
研究者认为,
相较于文献[5]中的单一算法,
所提出的方法不仅提升了分类精度而且降低了计算效率。
文献[7]则采用了完全不同的策略:
引入Nakagami分布模型,
通过生成一组Nakagami图像映射作为卷积神经网络(CNN)训练数据集,
从而消除了传统方法中对人工特征选择的需求。
尽管文献[5–7]中的实验取得了令人满意的结果,
但由于样本数量有限且来源多样性高,
这限制了其推广的有效性以及结果间的可比性分析。
此外,
文献[8,9]
另辟蹊径地尝试使用多种CNN架构来定位感兴趣区域(ROIs)。
通过对不同架构性能与其它机器学习方法进行对比发现:
相较于传统径向梯度指数等线性模型而言,
CNN架构带来了整体病变定位性能上的提升。
由于深度学习技术(特别是卷积神经网络)在全球范围内的广泛应用,在医学影像分析领域也取得了显著进展。因此,在美国(US)成像领域中,卷积神经网络架构(基于相对较小的数据集)在乳腺肿瘤分类任务中的性能是否能够超越传统的机器学习方法?为此,在文献[10]所采用的美国(US)图像数据集中应用了最先进的卷积神经网络模型来进行乳腺肿瘤的分类分析。根据现有研究可知,在美国(US)成像场景下采用基于形态学和纹理特征的提取方法用于对乳腺肿瘤进行分类的研究极为罕见甚至并不存在相关工作支持这一方向的研究探索。我们相信这一结果将有望为该领域的研究者提供重要的参考依据
三、方法
我们开发了US肿瘤分类系统的五个核心环节:首先进行图像预处理步骤;然后通过深度卷积层实现自动特征提取机制;接着基于Softmax函数进行图像分类;随后实施超参数优化过程及正则化措施;并最终完成评估过程。
1、数据集
该研究所 breast ultrasound image dataset was collected during routine breast diagnostic procedures. This dataset consists of 641 images, all of which were classified into benign and malignant categories based on histopathological examination. The images were obtained directly from the 8-bit output signals of the Sonoline Sienna (索诺林·西耶娜型) ultrasound machine and saved in the 256-gray Tiff format. The INCa research ethics committee has approved this study (38/2001).
2、图像处理
在大多数神经网络架构中,默认假设所有输入图像具有相同的尺寸[11]。基于这一前提,在调整大小时必须以保持原始比例为基础进行尺寸选择。本研究开发了一种算法用于确定原始图像的最佳尺寸,并通过在角落补充零值来构建方阵。通过这种操作方式,在本研究中将图像调整至224×224像素(如图1所示),同时保持了原有的比例关系。此外采用归一化处理措施(Zero Normalization)旨在使数据均值为零、方差为一。这样梯度的变化更为均匀,并且能够有效加速学习过程[12]。

3、卷积神经网络
CNNs是一种深度网络,特别适用于许多计算机视觉应用。它们可以被认为是具有两个约束条件的标准神经网络[13]:局部连通性和权值共享。局部连通性意味着我们使用比输入图像小得多的卷积滤波器,权值共享意味着在整个图像中使用相同的滤波器。CNN的初始层是局部连通的,包含卷积、池化和一些非线性函数,如整流线性单元(ReLU) [11]。CNNs的形成是为了实现不同的抽象层次;第一层代表试图提取特征的低级抽象,如定向边;中间层描述了更高层次的抽象,例如角和角度,而最后一层可以描述一个完整的对象[11]。在这项工作中,我们实现了一个CNN网络(图2),由四个不同大小的卷积层组成,代表不同的特征图。每个卷积层后面是一个ReLU和一个最大池。最大池层用于降低维数,使网络对输入对象的位置更加不变[11]。ReLU用作激活函数,每一层添加非线性。非线性确保了更具表现力的模型[11]。与使用局部连通性的卷积层相反,完全连接层由矩阵乘法组成,将前一层中的每个单元连接到最后一层中的每个单元。最后一个全连接层的输出被馈送到Softmax函数,该函数表示一个分类分布,并计算每个输入属于一个已定义类别的概率[14]。

四、提高网络性能
深度神经网络对大量样本依赖较大,在拥有更多数据的情况下会表现出更好的性能[11]。发现高质量的生物医学数据资源是一项具有挑战性的任务[15]。现有数据资源往往数量有限,在本文中使用的这类数据集也不例外。为了解决这些问题,在保证模型性能的同时避免过拟合问题出现的方法已经被提出,并在此基础上我们引入了图像增强、L2正则化以及Dropout技术。
图像增强是一种基于原始数据生成新批次技术的有效方法。通过提高训练数据集规模的方式可降低模型过拟合风险[14]。在本研究中为平衡良性与恶性类别样本数量需求,在前一部分图像上应用了反射变换与旋转相结合的数据增强策略。
L2正则化的思想是在损失函数中增加一个额外的一项(如等式1所示),该项由特定因子构成。

缩放的所有网络权重的平方和, 抵消了较大权重的作用。另一种说法是, 选择适当的

有助于网络在最小化代价函数和寻找小权重之间达成更好的妥协[11]。

在等式1中,第一项代表交叉熵损失函数,在此框架中n代表训练数据集的规模;y代表预期输出结果;p则是各个类别对应的概率分布;此外,在损失函数的计算中还包含了正则化项;具体来说,这一项通过λ来控制正则化强度参数;

是正则化参数,W表示网络的权重。
使用了Dropout正则化方法,在CNN的训练过程中。通过随机的概率值设置,在层内有选择性地抑制神经元的激活。该方法能够有效降低模型过拟合的风险,并且能够显著降低网络复杂度(参考文献:[15])。这一技术已被广泛应用于深度学习领域(参考文献:[15])。
五、实验
1、实验设置
我们评估了所提出的架构的性能,应用了各种超参数调整和正则化技术。数据集被分割以执行五折交叉验证,其中80%的数据用于训练,20%用于测试。重复这个过程五次,每次选择一个不同的集合作为测试集合,我们保证所有的子集都用于训练和测试。图像增强是通过随机翻转和旋转图像并将这些增强的图像添加到训练集中来应用的。批量大小被设置为64,并且0.001的固定学习速率被应用于网络。为了进一步避免过拟合,在最后一个完全连接的层之前添加一个概率为0.5的Dropout层,并将

将L2正则化系数设定为0.01,在本研究中将其视为模型正则化的关键参数。研究中采用的评估指标包括准确率(Eq. 2)、特异性(Eq. 3)、灵敏度(Eq. 4)、精度(Eq. 5)、误报率(Eq. 6)以及ROC曲线下面积(AUC)。这些指标共同构成了模型性能评估的标准体系。

2、结果
表1列出了应用图像增强与正则化前后系统的性能指标对比。由于所给数据集规模较小,在测试过程中容易出现过拟合现象。通过实施图像增强、优化超参数配置以及合理应用正则化手段,在准确率和AUC指标方面均实现了显著提升(如图3所示)。


为了更全面地评估我们提出的方法的效果, 我们采用了已知的一些预训练模型, 并在表2中进行了结果对比。这些预先训练好的模型是在大规模数据集上经过大量学习得到的, 虽然所用图像与之前的网络不同, 但它们具有类似的特征, 通过简单的微调方法可以在新的数据集上迁移这些预先训练好的模型。

此外采用了不同方法对AUC值进行了比较。如文献[10]所展示,在相同的训练数据集上采用的手动形态与纹理特征属性作为研究对象。然而这些研究并未采用基于自动特征选择的方法。研究者分别基于纹理特性和形状特征求取了相应的AUC值分别为0.897与0.942。表3总结了每种方法获得的最佳AUC值

六、结论
在本研究中,我们系统地探讨了深度学习技术及其在乳腺超声图像异常分类中的应用,重点考察了卷积神经网络(CNNs)的表现优势。通过设计一个包含四个卷积层的网络架构,我们成功实现了对US图像的分类任务,将结果划分为良性与恶性两类。为了优化网络性能并解决过拟合问题,我们进行了全面的实验研究,深入探讨了多种超参数设置和正则化策略,包括数据增强技术、L2正则化方法以及Dropout技术的应用效果。在评估系统性能时,我们采用了准确率指标以及基于ROC曲线下的曲线下面积(AUC)作为关键评价标准,这种综合性的评估方法能够全面反映模型的分类能力与可靠性水平。实验结果表明,所提出的系统即便未施加任何额外的正则化措施仍能实现86.12%的整体准确率和0.9394的AUC值;而经过正则化技术和微调优化后,AUC值显著提升至0.9706,AUC值较之前提升明显可见其卓越的表现能力值得信赖
虽然所提出的方法显示出令人鼓舞的效果,并在肿瘤分类任务中达到了AUC=0.9706这一较高水平(这一水平通常被视为优秀),但我们的模型仍有改进空间。众所周知,在数据量更为丰富的场景下,卷积神经网络(CNNs)的表现通常会得到提升。在此项研究中由于所使用的数据集规模相对较小并且采用了较为简单的隐藏层结构以避免过拟合现象(具体措施是通过限制网络复杂度来防止模型过于依赖训练数据)。展望未来我们计划进一步扩大数据采集规模引入更加复杂的CNN架构以及开发更加鲁棒的系统性方法以缩小与人类水平之间的性能差距
