基于深度学习的腰椎间盘突出症辅助诊断
摘要
为解决腰椎骨结构复杂导致智能辅助诊断难度高的问题,在设计U-Net编码器和解码器时,在其基础架构中引入Resblock模块,并保留原有的跳跃连接机制以增强目标区域特征传递的同时减少特征丢失并加快模型收敛速度。基于最小包络矩形法对椎体中心位置进行精确定位之后将定位结果应用至椎骨矢状面原图上实现目标区域的自动提取过程。在Xception网络架构中通过替代Flatten操作引入平均池化层并搭配BN层和Dropout层优化模型性能以进一步提升分类效率并动态调节学习率以达到更高的分类准确度和诊断效能相比现有研究该框架在测试集上的表现具有明显优势为临床实践提供了切实可行的技术支撑
关键词
机器学习; U-Net; [脊柱健康评估; ](https://xueshu.baidu.com/s?wd=��%
%E5%B9%B0%E7%B1%
%E5%B0%B7%E7%A4%
%E7%B1%
%E7%A4%
%E7%B1%
"%2F"]Xception;
骨质分割;
[智能医疗支持系统](https://xueshu.baidu.com/s?wd=�%
%99%
%BA%E8%
%83%
%BD%E8%
%BE%
%85%E5%
%BAA%E9%
%AA%E4%
"%2F"[智能医疗支持系统])
0 引言
腰椎间盘突出症(Lumbar Disc Herniation LDH)属于骨科常见的疾病类型之一,并在下背部疼痛中有重要临床意义[1,2]。
研究表明显示我国约50%的成年人患有此病症,并呈现逐年加速上升的趋势[3]。
其中磁共振成像技术与电子计算机断层扫描被认为是检测的主要手段[4]。
其中医生通过分析影像数据确定突出部位及其程度。
受制于自身的医学知识背景影响可能导致诊断结果不一致甚至出现误诊[5]。
同时随着大量图像数据的应用也在逐步增加对诊断工作的挑战,
因此开发高效精准的诊断方法对于患者治疗和减轻医疗工作者负担具有重要意义[6]。
译
近几十年来,在各种脊柱疾病领域中,计算机辅助诊断系统(Computer-aided Diagnosis, CAD)技术已经取得了显著的发展成果[7]。传统LDH-CAD系统的构建主要依赖于机器学习算法与特定的图像处理技术相结合的技术路线[8];然而,在临床应用中提取图像特征仍需依赖人工操作,在大量的人力和时间成本上存在明显不足[9]。
译
深度学习(Deep learning, DL)的发展推动了CAD进入智能时代,并促使众多研究人员致力于将深度学习技术与计算机辅助设计相结合[10]。例如,Mbarki等[11]研发了一个基于深度卷积神经网络的自动化系统,该系统采用VGG16架构识别腰椎间盘突出,其模型准确率达到94%。Ghosh等[12]提出了全自动化辅助诊断系统,通过支持向量机(Support Vector Machine, SVM)等分类器提高诊断效率,实验表明该系统对35例T2-SPIR矢状面影像的诊断准确率为94.85%。Hao等[13,14]在辅助诊断中引入了椎间盘形态特征及MR T1加权特征,并进行了数据增强处理,以进一步提升诊断准确性。Jamaludin等[15]则通过卷积神经网络(Convolutional Neural Networks, CNN)实现了无需人工特征提取的自动化图像分类功能。
译
因为椎骨不仅形状复杂且多变,在结构上还存在相似之处,并且受到个体差异及与肋骨的空间关系影响,在实现其分割与椎间盘定位时依然面临诸多挑战[11]。当前,在临床应用中现有模型仍面临准确性不足、训练样本数量有限以及移植性较差等问题。
译
在此基础上, 本文在现有研究基础之上提出了一种基于深度学习的计算机辅助诊断LDH的方法框架, 其主要目标在于推动基于深度学习的计算机辅助诊断系统的临床实践, 并为临床医生提供一种可重复性的决策支持工具, 从而以降低误诊率并减轻工作负担
译
1 研究方法
本研究提出了一种辅助诊断系统,该系统主要由两部分组成:第一部分利用ResU-Net模型实现椎骨区域的精确分割;第二部分则结合优化后的Xception网络架构对腰椎间盘突出症进行分类识别。具体算法设计及其工作流程可在图1中详细展示。
译

图1 算法流程
Fig. 1 Algorithm flow

下载: 原图 | 高精图 | 低精图
1.1 椎骨分割模型
本文采用在医学图像分割领域表现出色的U-Net网络作为椎骨分割模型。其独特的U型结构使得在上采样过程中能够有效地融合下采样阶段所保留的高分辨率细节信息,在提升分割精度方面取得了显著效果[16]。针对过深网络可能导致的梯度爆炸和模型退化问题,残差网络(ResNet)通过引入层间跳跃连接机制得以有效解决。具体而言,在每层处理时会将输入与输出特征进行融合后进行激活并输出]
译
本文融合了U-Net与ResNet技术的基础上提出了一个新的网络架构——ResU-Net。该网络架构保留了传统的U-网主体结构,在其经典的下采样和平移模块中巧妙地集成了一种基于残差块(ResBlock)的设计(见图2)。通过这一创新设计,在不牺牲原有分割效果的前提下显著加快了模型收敛速度并减少了训练时间;同时通过将上一层特征与当前层提取出的特征进行深度融合处理,在保持原有分割效果的基础上进一步提升了模型性能。
译

图2 ResU-Net结构图
Fig. 2 ResU-Net structure

下载: 原图 | 高精图 | 低精图
1.2 腰椎间盘突出症诊断模型
该研究由Chollet[18]基于Inception网络开展,并提出了Xceptio
n方法。该方法通过将传统的深度可分离卷积模块替代了传统的Inceptio
n模块。在实际操作中进行通道与空间信息的分离开,在图像的空间维度进
行信息提取。随后通过1×1尺寸的全连接层整合各通道的信息。
译
该研究设计了一种基于深度学习的手势识别系统,在实验中采用了改进型深度卷积神经网络架构(Xception)。具体而言, 该系统通过36个卷积层实现特征提取, 并将其划分为14个功能模块, 采用大量残差块替代Inception的连接方式以扩大网络深度, 这一设计不仅显著提高了模型对复杂手势识别的能力, 还能加快收敛速度. 在保留了Inception系列模型核心优势的同时, 本系统进一步提升了轻量化性能指标. 因此, 在本研究中采用该架构作为LDH诊断系统的主干模块
译
此外,在数据量规模偏小的情况下(考虑到)为了避免模型出现过拟合的风险(有效避免),本文采取了多项优化措施:首先,在Xception网络架构中(移除了原有的)原有全连接层,并增加了自己设计的专用分支结构;其次,在图像数据预处理阶段(经过归一化处理后)将其作为输入传递给网络;再次运用EarlyStop机制来有效抑制了模型过拟合的现象;最后采用了动态学习率策略以能够迅速且准确地收敛至最佳参数设置。这些改进措施使得优化后的网络架构得以在图3中清晰展示。
译

图3 优化后的网络层结构
Fig. 3 Optimized network layer structure

下载: 原图 | 高精图 | 低精图
2 实验结果与分析
基于DICOM格式的数据作为研究案例来源。这些数据全部来自上海某家三甲医院。所有图像均由西门子3.0T MAGNETOM Skyra系统获取。共包含54个病例样本。每个病例的椎间盘突出程度各不相同。这些病例患者的年龄普遍在20至61岁之间。其中男性患者有29例、女性患者有25例。
译
该文的所有实验均在一台工作站(配备Intel Core i7-9700KF处理器、NVIDIA RTX-2070 Super显卡及8GB显存、32GB内存)上运行,并经过训练并用于测试。文中所述算法基于Matlab平台开发,并采用Python语言编写代码;为了实现目标功能而借助TensorFlow框架以及Keras接口进行开发工作;项目采用JetBrains PyCharm Community Edition 2017作为开发环境,并配合Matlab R2016b软件完成相关工作流程。
译
2.1 ResU-Net分割模型评估
2.1.1 数据预处理
首先,在来自矢状位MR T2加权图像的54个病例中选择出用于训练的数据集共包含44组样本,并将剩余10组分别用作测试和验证用例。随后,在Labelme软件中对训练集进行椎骨区域的标注(如图4所示)。最后将图像进行二值化处理(如图4b所示),并将其作为模型训练的标签。整个标注过程在专业医师监督下完成,并确保所有处理后的图像尺寸一致(均为320×320像素),且深度保持在8位。
译


下载: | 高精图 | 低精图
图4 数据集标注过程示意
Fig. 4 Schematic diagram of the dataset annotation process
2.1.2 评价指标
在评估医学图像分割模型的性能时会涉及以下关键指标:真阳性(True Positives, TP)表示被正确识别为真类的对象;假阳性(False Positives, FP)指被错误分类为真类的对象;真阴性(True Negatives, TN)代表被正确识别为假类的对象;假阴性(False Negatives, FN)则是被错误分类为假类的对象。本文采用交并比(Intersection over Union, IOU)、Dice相似系数及召回率(Recall)等指标来量化模型的表现效果。其中交并比用于衡量预测区域与真实区域的重叠程度,其取值范围介于0至1之间。当IOU值接近1时,则表明模型预测区域与真实区域的高度吻合;反之则反之。Dice相似系数同样在0至1之间变化,在数值趋近于1时则表明模型具有较高的准确性。召回率通过比较分割前后的像素差异来评估模型的效果,在值域上也是0至1之间。当Recall值接近1时,则意味着分类正确的像素比例较高,从而反映出模型更强的分割能力
译
| IOU=TPTP+FN+FP | (1) | |
|---|---|---|
| Dice=2×TPTP+FN+(TP+FP) | (2) |
| Recall=TPTP+FN | (3) |
|---|
2.1.3 模型评估
本研究采用ResU-Net网络对MR图像进行椎骨部位的分割任务求解,在经过多轮训练优化后成功获取了最佳性能的模型版本;随后将该模型应用于测试集数据集进行性能评估,并与经典的U-Net架构以及人工标注的标准进行了系统性对比实验;最终实验结果表明所提方法在分割精度方面优于现有算法(如图5所示)。
译

图5 椎骨分割结果
Fig. 5 Segmentation results of spinal

下载: 原图 | 高精图 | 低精图
本研究通过表1展示了系统性评估结果。经对比分析发现,在多个关键指标上(包括IOU值、Dice相似系数及Recall分数)ResU-Net模型均显著高于传统架构的U-Net设计,在所构建的数据集上展现出更为卓越的性能表现,在分割效果方面更具优势。
译
表1 椎骨分割结果( % )
Table 1 Vertebral segmentation results
| Method | IOU | Dice相似系数 | Recall |
|---|---|---|---|
| U-Net | 97.81 | 94.89 | 97.65 |
| ResU-Net | 98.94 | 96.11 | 99.12 |

获取标准格式文件:CSV

下载: 表格图片
2.2 椎骨的中心定位与裁剪
对经分割处理的二值化脊柱骨骸图像中,在应用面积滤波去除一些残留的噪声后,在Python-OpenCV框架下提取出该区域的轮廓及其中心点位置(如图6所示)。随后将这些关键位置数据依次记录至txt文件中,并在后续步骤中可直接调用这些数据来实现所需区域-of-interest(ROI)的精准提取。
译


下载: | 高精图 | 低精图
图6 椎骨中心标记和记录
Fig. 6 Marking and recoding of vertebral center
基于获取的所有椎骨中心点坐标的定位结果,在矢状位原始图像上执行裁剪操作。裁剪区域的具体尺寸参数由经验丰富的专业医生依据腰椎间盘病灶区域(ROI)的标准尺寸来设定,并且固定为统一的48×48像素范围。具体而言,在完成所有必要的解剖学定位后,在每个目标点位置的基础上向后延伸并截取相应的等大正方形窗格进行观察分析(如图7所示)。
译

图7 ROI图像裁剪结果
Fig. 7 ROI area clipped results

下载: 原图 | 高精图 | 低精图
2.3 改进的Xception诊断模型评估
2.3.1 数据预处理
本文从54例腰椎间隙光核磁共振成像(MRI)病例中提取中心切片及邻近中心两侧的切片,并基于预训练优化的ResU-Net模型完成脊柱椎体分割及自动定位裁剪操作以获取目标区域(ROI),最终获得了1,082份样本数据(其中正常病例681例、突出病例401例)。鉴于所选病例的影像尺寸(48×48像素)偏小且样本数量有限,这将不利于卷积神经网络模型的有效特征提取与训练过程;因此建议对原始数据集实施增强处理以提高模型训练效果。
译
基于样本为医学图像的数据集构建中
译

图8 数据集扩增结果
Fig. 8 Dataset amplification results

下载: 原图 | 高精图 | 低精图
gamma图像变换、log图像变换公式如式(4)、式(5)所示。
译
| Gout=GinR | (4) | |
|---|---|---|
| y=alog(1+x) | (5) |
在该公式中:Gout表示增强后的图像 Gin代表输入原始图像 灰度映射参数_R_被引入以调节对比度提升效果 当取_R_=1.5时 系统能够有效提升高亮度区域的空间对比度 放大系数_a_用于控制图像细节的放大程度 输入像素_x_i,y_i对应经过处理后得到输出像素_y_i,x_i
译
2.3.2 模型评价指标
在评估分类模型时,我们仍然采用上述四个关键指标来进行性能分析。在二类分类问题中,准确率(Accuracy;ACC)是一个衡量模型分类能力的重要指标。尽管医学诊断的重要性不可小觑,在实际应用中还需要对分类结果中的真实阳性、假阳性、真实阴性和假阴性进行详细统计;仅仅依赖于准确率难以全面评估模型的表现。
译
为了评估模型性能,在本研究中我们采用了特异性(Specificity, SPE)、灵敏性(Sensitivity, SEN)以及精确率(Precision, PRE)作为主要评价指标。具体而言:
- 正确率代表实验中所有样本被正确分类的比例;
- 特异性衡量了所有负样本被正确识别的比例;
- 灵敏性反映了所有正样本被正确识别的比例;
- 精确率计算了被预测为正类的样本中实际为正类的比例。
相应的计算公式如下:
\text{Correct Rate} = \frac{\text{TP} + \text{TN}}{\text{Total}}
\text{SPE} = \frac{\text{TN}}{\text{TN} + \text{FP}}
\text{SEN} = \frac{\text{TP}}{\text{TP} + \text{FN}}
\text{Precision (PRE)} = \frac{\text{TP}}{\text{TP} + \text{FP}}
译
| ACC=TP+TNTP+TN++FP+FN | (6) | |
|---|---|---|
| SPE=TNTN+FP | (7) |
| SEN=TPTP+FN | (8) | |
|---|---|---|
| PRE=TPTP+FP | (9) |
2.3.3 模型评估
本文分别对ResNet50、Xception及其改进版进行了建模测试。人工组负责将测试集交给专业医师进行诊断分类。通过包括正确率、特异性、灵敏度、精确度以及耗时在内的评估指标来比较两组模型的结果差异。具体分类诊断结果可见表2,请注意加粗显示的指标即为最优表现。
译
表2 LDH计算机辅助诊断结果
Table 2.1 Computer-assisted diagnostic system for lumbar region intervertebral disc herniation analysis
| Method | ACC/% | SPE/% | SEN/% | PRE/% | 消耗时间/min |
|---|---|---|---|---|---|
| ResNet-50 | 90.22 | 85.46 | 93.12 | 91.85 | 4.0 |
| Xception 改进的Xception 人工诊断 Ghosh等[12] Dhillon等[21] Oktay等[14] | 92.75 94.32 85.71 70.75 86.28 92.81 | 87.65 90.13 85.36 75.6 87.4 94.6 | 95.65 97.09 85.92 64.3 84.38 89.8 | 93.06 94.46 91.04 - - - | 4.5 5 27 - - - |

获取该数据集:CSV

下载: 表格图片
从表2的数据可以看出,在基于深度学习技术实现的计算机辅助诊断系统与传统的人工诊断手段之间存在明显的性能差异。具体而言,在辅助诊疗速度方面(Xception网络)以及诊疗结果准确性方面(ResNet50表现最差),深度学习方法均显示出显著优势。与现有相关研究相比,在本研究中采用的方法显著提高了计算机辅助诊疗系统的正确率(SPE得分低于文献[14]的结果可能源于数据集中异常椎间盘占比较低导致);然而,在某些关键指标上仍存在不足。值得注意的是,在优化后的Xception网络在性能指标上均优于基准模型(如比较模型),但在计算资源上的额外消耗则可能导致其在某些指标上略逊一筹。相比之下,则是由于特征提取阶段过度捕获了非关键信息而表现欠佳
译
相较于ResNet50模型而言,Xception采用了独特的深度可分离卷积模块设计。该模块通过对各通道分别进行深度可分离卷积操作,在逐步分析和筛选特征信息的基础上,输出精炼的特征供全连接层完成分类任务。同时,在Xception架构中融入了残差连接机制,并显著地提高了模型的整体训练效率。
译
3 结语
本研究开发了一种基于深度学习技术的LDH辅助诊断系统。该系统通过构建矢状位MR T2加权图像用于腰椎椎骨分割的数据集以及用于LDH诊断的数据集。采用优化后的ResU-Net与Xception网络架构以实现区域感兴趣(ROI)图像提取,并训练出辅助诊断模型。该系统能够显著提高诊断LDH病灶的速度与准确性。
译
本研究通过实验数据分析表明,在所选数据集上实施的深度学习算法框架具有较高的诊断效果显著性。其中经过优化设计后的Xception模型在测试指标上明显优于其他常用深度学习模型,在各评估指标维度上均展现出更强的优势与竞争力;这证明了该算法体系对于辅助医生完成LDH(low back pain)诊疗工作的可行性与有效性。未来工作将从以下三个维度进行系统性改进:首先将重点放在扩充训练数据集上以满足更大规模的数据训练需求;其次将注重平衡正负类样本数量以最大限度地发挥现有算法架构的最大效能;最后针对现有算法架构进行优化设计以提高模型分类诊断精度。
