基于深度学习的肺部CT影像识别——采用U-net、3D CNN、cGAN实现肺结节的检测(一)
该文本介绍了U-net模型在医学图像分割中的应用,特别是在肺结节分割方面。U-net通过多尺度卷积神经网络提取特征,结合收缩路径和对称扩张路径,能够高效提取语义信息并生成精确分割结果。实现过程中,基于SongpingWang的代码,尽管存在数据预处理不足的问题,但通过预训练模型和数据集(可通过特定链接下载),模型在实验中表现良好,准确率在50%左右。实验结果展示了U-net在结节定位上的有效性,为医学影像诊断提供了辅助工具。
文章目录
-
引言
-
U-net分割模型
-
- 算法原理
-
实现过程
-
实验结果
-
参考
引言
在医学图像处理领域,传统特征提取方法主要依赖于具有先验知识的特征提取和感兴趣区域的确定,这直接决定了肺结节检测的准确性。相比之下,卷积神经网络无需人工特征提取,通过深度学习方法,随着卷积神经网络层数的增加,能够提取出更加抽象和语义丰富的特征。在这里,我们首先采用U-net模型将肺结节分割出来,生成候选集,从而为后续的检测提供基础。
U-net分割模型
算法原理
卷积神经网络(CNN)的主要应用之一是图像分类任务,为每个图像分配一个类别标签。然而,在生物医学图像处理领域,分割任务更为常见,它要求将相应的类别标签分配给每个像素。语义图像分割的目标是为图像中的每一个像素赋予特定的语义标签,并建立像素与其所属类别之间的对应关系。2013年,Farabet等人提出了一个多尺度卷积分类网络。该网络以某个分类的像素为中心,通过多尺度采样获取局部图像块,并将这些多尺度的局部特征输入CNN分类器进行逐一识别,最终确定每个像素所属的语义类别。然而,由于逐像素采样的方式仅能捕捉到局部特征,因此整体语义信息的丰富性仍然不足。
除了语义信息提取的困难之外,海量的训练数据在生物医学任务中通常难以获取。为了解决这些问题,基于FCN的U-Net应运而生,具有显著的影响。U-Net是一个全卷积神经网络模型,它能够在很少的训练图像下运行,提取多层次的特征,并输出较为精确的分割结果。
FCN的主要思路是通过将全连接层替换成卷积层来实现特征提取,其中池化层被上采样层替代,从而提高了输出层的空间分辨率。为了实现定位,将来自收缩路径的高分辨率特征图与上采样输出进行融合。因此,一个连续的卷积层可以有效地学习并集成更精确的输出信息。相比之下,U-Net网络通过收缩路径和对称扩张路径分别提取上下文信息和定位目标,如图所示。该网络结构中没有全连接层,且每个卷积层仅利用其有效部分进行计算,从而能够使用较少的训练数据实现端到端的高效学习并获得最佳性能。

实现过程
基于SongpingWang[1]在其系列博客中提供的代码实现了应用。但是,该代码存在两个主要缺陷:其一,缺乏针对XML标注文件的处理模块,导致无法直接从DICOM文件生成mask训练数据;其二,缺乏将处理后的图片及其mask路径写入txt文件的功能。具体来说,该缺陷的出现源于未能直接从DICOM文件生成mask训练数据,而是需要通过将训练数据的路径写入txt文件,然后读取该文件得到图像索引,并通过random.shuffle()操作图像索引来打乱图像。这一预处理技巧的目的是为了避免数据分布过于规律,从而防止过拟合或训练不收敛的问题,毕竟训练数据的规模较为有限。
此外,SongpingWang先生还提供了3DCNN假阳性过滤模块的代码,但当我尝试使用他开源的预训练模型,或者从零开始进行模型训练时,分类准确率维持在50%左右,这在实际应用中并无显著价值。可能代码中存在某些问题,我未能深入探究。因此,我采用了U-Net算法来提取候选病变结节,并使用了他预处理好的训练数据集。**关于假阳性过滤部分,我参考了另一个3DCNN模型的实现,具体内容将在下篇博客中详细说明。
这里给出SongpingWang分享的处理好的数据和预训练模型:
数据集下载页面:https://pan.baidu.com/s/1zG_xP_NzAIA5CMOJIVf73Q 提取码为9yd2
U-net及3DCNN预训练模型下载链接:https://pan.baidu.com/s/1iHYdyRmx1YDjtDaGEXkshA 提取码为ku7b
实验结果
在U-net肺结节提取模型的训练过程中,共计70个循环周期,每个循环内部均进行300次参数更新,实验批大小设置为16。本研究中采用随机梯度下降(SGD)算法进行模型优化,预设的学习率为0.001,并结合动量优化策略以提升训练效率。U-net模型的损失曲线图和训练集的准确率曲线图如图所示。


在本研究中,U-net模型输出的结果仅包含结节的位置坐标信息。通过OpenCV的cv2.rectangle()函数绘制了矩形框作为标注,便于直观观察。通过可视化技术,结果如图所示,其中孤立的实性结节和非实质性结节均能被精确检测出来,对医学临床诊断具有辅助参考价值。

参考
[1]
