深度学习在胰腺医学影像中的应用综述
摘要
胰腺癌具有隐匿性发病及较差的预后特征,在消化道恶性肿瘤中具有重要的临床意义。目前深度学习技术已在多个领域展现出显著的应用价值,在医学影像分析方面也取得了突破性进展。综述其发展历程及应用现状的基础上,并结合当前研究热点问题与未来发展趋势展开探讨。本文将系统梳理深度学习在胰腺病理图像分析、CT影像诊断以及超声图像解读等领域的研究进展,并对未来可能的研究方向和发展趋势进行深入探讨和展望
0 引言
胰腺癌常呈隐性病灶形式并具有较差的预后。通过对临床数据的统计分析发现,在所有接受治疗的胰腺癌病例中约有8%能够存活至第五年[1-2]。一旦发生肿瘤转移其五年生存率降至约3%[1-2]。虽然目前采用医学影像技术(如CT扫描)作为初步筛查手段但由于各种因素限制其准确性仍有待提高[3]
伴随着人工智能技术的进步, 深度学习作为一种核心技术, 在相关领域的研究已取得显著进展[4-5]. 其成熟程度进一步提升为辅助医疗诊断提供了新的可能性[4-5]. 当前其在医学影像领域中的应用范围已经非常广, 并获得了诸多研究成果[6], 但针对其在胰腺相关医学图像分析方面相关的系统性综述尚显不足. 因此, 本文旨在对此展开系统回顾与分析, 以期为此领域的后续研究提供参考依据或指导方向. 本文全面梳理了深度学习发展历程, 包括基础理论到实际应用的关键节点, 同时重点探讨了其在胰腺组织病理图像、CT图像及超声图像等领域的具体应用场景, 进一步阐述了当前阶段所面临的技术挑战以及对未来发展的潜在方向进行了深入探讨.
1 深度学习发展史
1.1 深度学习起源
从20世纪40年代起,在心理学家McCilloch与数学逻辑学家Pitts[7]共同推动下的人工神经网络研究初具雏形。随后于20世纪50年代中期计算机科学家Rosenblatt成功开发出一种模仿人类学习机制的学习算法(即感知机学习)并建立了相应的神经网络模型。然而到了20世纪60年代末期《感知器》一书由Marvin等[9]编写而成,并揭示了该类模型本质上仅能处理线性可分问题(Linear Model),从而导致人工神经网络领域迎来了第一个‘寒冬期’直至近20年趋于停滞
1.2 深度学习发展
1986年, 神经网络之父Hinton首次提出了一种被广泛应用于多层感知器(MLP)的反向传播(BackPropagation, BP)算法,该算法基于Sigmoid函数实现了非线性映射,成功突破了这一难题,并因此推动了神经网络研究的复兴[10]. 但是,受限于当时的计算硬件水平,当神经网络规模增大时,在计算过程中会出现梯度消失现象,从而影响模型的有效训练. 这一挑战使得深度学习技术的发展一度陷入瓶颈.
1.3 深度学习爆发
2006年,Hinton等[11]在顶级期刊《科学》上发布了解决梯度消失问题的方法:通过基于无监督的方法对权值进行初始化,随后采用有监督的方式完成微调过程。该论文一经发布便引发了学术界的广泛关注,迅速推动了深度学习领域的研究热潮。2012年,Hinton课题组凭借深度学习模型AlexNet在ImageNet图像识别比赛中取得了冠军的成绩,首次引入了ReLU激活函数,有效缓解了梯度消失问题。随着深度学习算法在各类比赛中的优异表现,CNN等基于深度学习的模型也得到了更深入的研究[12-14]。
2 深度学习在胰腺医学图像诊断中的应用
2.1 深度学习在胰腺病理学图像上的应用
组织病理学是临床肿瘤诊断的重要手段,在影像学检查结果作为辅助依据的同时,病理切片分析工作量巨大。一名专业的病理医生平均每天需完成约400例(参考文献:15)切片分析任务,在积累数千例病例经验的基础上才能形成稳定的诊断能力(参考文献:16)。目前我国仅存的一万余名专业病理医生缺口仍达90%,这一现象凸显了当前医疗资源分配与人才发展需求之间的严重失衡(参考文献:16)。
目前深度学习技术在组织病理学领域已得到广泛应用。例如,在Camelyon乳腺癌淋巴结转移分类挑战赛中,Wang等[17]通过建立基于GoogleNet模型的方法实现了该模型在该比赛中的最高受试者工作特征曲线下面积(AUC)值为0.925的研究成果[17]。此外,在胰腺疾病诊断方面,Momeni-Boroujeni等[18]开发了基于多层感知器神经网络(MNN)的方法,并将其应用于胰腺细针穿刺活检细胞图像的分析,最终实现了非典型病例良恶性分类准确率高达77%的目标[18]。进一步研究表明,Krzysztof等[19]通过建立基于神经网络模型的新方法,成功对胰腺管内增生性病变样本进行了分类,其细胞核分类正确率达到73%,这为探索胰腺导管癌早期诊断方法奠定了理论基础[19]
先前的研究主要采用了较为基础的模型结构。这一发现可能为后续研究提供有价值的参考。未来研究可以进一步探索更为复杂且精确的模型架构。当前,在胰腺组织病理图像分析领域中应用深度学习技术仍处于起步阶段。其中一个主要原因在于获取高质量胰腺病理图像数据集相对困难。基于此,进一步的研究工作仍有必要展开。
2.2 深度学习在胰腺CT图像上的应用
电子计算机断层扫描技术(Computed Tomography, CT)通过精确且准直的X射线束、γ射线以及超声波等手段配合灵敏度极高的探测器,在人体特定病变区域进行连续层面的扫描。该技术以其快速成像和高清晰度的特点,在医疗领域已被广泛应用于多个领域。此外,在CT图像领域的研究也取得了重要进展。其中基于CT图像的高精度胰腺识别被视为医学影像分析的关键部分[20]。然而由于胰腺在全身性腹部CT影像中的呈现比例相对较小,因此其分割仍然面临较大的挑战性问题[21]
针对胰腺CT图像分割问题,Roth团队[22]开发了一种基于多层卷积神经网络的概率自底向上腹部CT胰腺分割方法,其Dice相似性系数(DSC)值为83.6±6.3%.杨争争团队[23]设计了一种双向卷积门控循环网络(Bi-Directional Convolutional Gated Recurrent Unit,BDC-GRU),该方法显著提升了胰腺分割的准确性,DSC值达到了87.63%.Zhao团队[24]构建了一个基于卷积神经网络的两阶段自动胰腺分割模型,在NIT数据集上的平均Dice相似性系数(DSC)达85.99%.Liu团队[25]采用U-Net架构,并结合边界框检测技术对CT数据进行处理.此外,在NIS数据集上实现了Dice相似性系数(DSC)值为86.70%.Ma团队[26]提出了结合深度卷积网络的贝叶斯模型,在NIS数据集上实现了Dice相似性系数(DSC)值为85.32%,如表1所示
Table 1: Application of Deep Learning Techniques in Pancreatic CT Imaging Segmentation Analysis
表1深度学习在胰腺CT图像分割上的应用
| 作者 | 模型 | DSC**(%)** |
|---|---|---|
| Roth等 | 多层深度卷积网络 | 83.6±6.3 |
| 杨争争 | 双向卷积门控循环网络 | 87.63 |
| Zhao等 | 卷积神经网络 | 85.99 |
| Liu等 | U-Net | 86.70 |
| Ma等 | 结合深度卷积网络的贝叶斯模型 | 85.32 |

下载: 导出 CSV
本研究采用深度学习模型对胰腺器官进行分割,并获得了较为显著的效果。该过程可分为两个主要阶段:首先搭建一个神经网络用于完成粗略划分任务,在此过程中能够识别并提取出单个胰腺器官的边缘框;随后再设计并训练一个卷积神经网络来精确定位这些边缘框的具体边界信息,在此过程中可进一步细化出完整的胰腺器官结构。值得指出的是,在当前医疗领域中基于深度学习技术的胰腺CT影像切片划分尚未得到广泛应用;因此,在未来的医学研究方向上需要进一步完善相关算法以实现对胰管以及肿瘤区域的精确划分工作;这一改进将为后续医学影像分析以及肿瘤消融方案提供更加可靠的技术支撑基础。
针对胰腺CT图像的良恶性分类预测问题,研究者Liu及其团队开发了一种基于深度学习技术的增强型CT图像识别系统。该系统通过卷积神经网络(CNN)实现了对复杂医学影像数据的高度解析能力,并且在测试集上的AUC值达到了0.96。这一结果表明,在极短时间内(约0.2秒)完成对单张CT图像的诊断任务具有显著的意义——这不仅提升了临床诊断效率的同时也为精确判断胰腺癌病变提供了可靠的技术支撑基础。此外,在三维深度监督网络的基础上进行的研究显示,在156例胰腺癌病例与300例正常病例之间实现了高灵敏度(94.1%)与高特异性(98.5%)并存的状态;而在针对台湾地区370名胰腺癌患者及320名健康对照者的对比测试中所建立的本地模型则表现出了令人瞩目的准确性(98.6%-98.9%),但当推广至美国公开胰腺病谱的数据集时其准确率却有所下降(仅达83.2%)。这些结果共同构成了一个完整的评估体系并揭示了不同数据源之间的关键差异
通过应用深度学习方法对CT图像进行良恶性鉴别实验研究显示,该方法实验结果表现良好,但在外验证集中检测准确率较内验证组仍存在一定差距,这可能与区域间胰腺CT成像质量存在显著差异有关,尤其是在不同医疗机构使用不同CT设备获取的成像数据之间表现出明显分化影响.当前研究主要聚焦于如何收集来自多分布的数据样本,而该算法通过学习机制能够有效缓解因影像质量不均导致外验证集中检测准确率下降的部分问题.展望未来,我们将进一步关注如何提升模型在多分布场景下的泛化能力,以期使其在各类型数据样本上的表现保持一致.
2.3 深度学习在胰腺超声图像上的应用
该系统采用将显微高frequency探头植入胃部结构的方法实现消化道内部成像功能
Ozkan等[31]开发并应用了一种基于多层感知机(MLP)的智能系统来分析胰腺EUS图像库中的332张图像样本,在该系统下实现了胰腺病变检测的高灵敏度(83.3%)、高特异性(93.3%)以及较高准确性(87.5%)。Sǎftoiu等[32]则创新性地将实时EUS弹性成像技术与MLP模型相结合,在区分胰腺癌良性与恶性方面取得了显著成果:通过将色调直方图信息转化为弹性成像帧的数量来构建特征集后,在该指标下的表现同样令人瞩目:检测敏感度达87.6%,特异性为82.9%,准确性维持在84.3%的水平。值得注意的是,在Kuwahara等[31]的研究基础上进一步深入探讨发现:深度学习算法可能成为诊断胰腺导管内乳头状粘液肿瘤(IPMNs)更为精确且客观的有效手段:其检测敏感度高达95.7%,特异性的水平也达到了92.6%,而准确率更是突破了94%,这显著高于人工诊断所获得的56%的标准值(如表2所示)。
Table 2 Application of deep learning in ultrasound image of pancreas
表2深度学习在胰腺超声图像上的应用
| 作者 | 深度学习模型 | 评价指标 | ||
|---|---|---|---|---|
| 灵敏度(%) | 特异性(%) | 准确率(%) | ||
| Ozkan等 | MLP | 83.3 | 93.3 | 87.5 |
| Sǎftoiu等 | MLP | 87.6 | 82.9 | 84.3 |
| Kuwahara等 | 神经网络 | 95.7 | 92.6 | 94.0 |

下载: 导出 CSV
现有研究仅基于单一中心的数据集开展分析,并未能充分证明该模型在不同数据集上的适用性。Kuwahara团队通过结合数据增强技术和迁移学习方法训练模型,并收集了超过50万张图像数据。该研究已具备构建高效模型的能力,并表明深度学习技术适用于评估IPMNs恶性程度的预判。然而由于这些研究仅涵盖外科手术案例,在临床实践中许多IPMNs患者并未接受手术治疗而是进行随访监测。这种情况下所获得的结果可能会导致评估结果存在偏差
3 结语
本文综述了深度学习的发展历程,并系统梳理了其在胰腺病理学图像、CT图像以及超声图像等领域的应用现状。当前,在胰腺影像领域仍面临诸多技术瓶颈:首要挑战是样本数量有限,这使得获取高质量的数据集面临诸多困难;其次,在实际应用中面临复杂的标注问题:该过程需要投入大量的人力资源;此外,在处理能力方面也存在明显局限:随着医学影像的分辨率持续提升(...),现有设备难以支持对高分辨率数据进行有效的处理工作;因此,在实际应用场景中往往需要将单幅高分辨率图像分割成多块进行处理运算
针对这些问题的挑战性需求,在科学研究领域中
