Advertisement

用于计算机断层扫描中胰腺导管腺癌检测的全自动深度学习框架

阅读量:

简单总结

该研究强调了影像学检查中对胰腺导管腺癌(PDAC)患者的早期识别对于改善其预后的关键作用,然而即使对于经验丰富的放射科专家来说这一任务仍充满挑战性。通过运用人工智能技术及深度学习模型结合大量数据资源的能力,在自动检测微小病灶(<2 cm)方面展现出显著优势。在本研究中我们开发并应用了一种自适应配置框架即nnUnet这一先进的医疗分割工具以建立一个全自动工作流程旨在精确识别并定位微小PDAC病变在增强对比的计算机断层扫描图像上特别关注这些小病灶区域。此外我们还评估了整合周围解剖结构信息对深度学习模型性能提升的影响。所开发的自动化解决方案已在公开可用的数据集上进行了外部验证结果显示基于深度学习算法能够有效识别微小型PDAC病变同时也能充分利用解剖学信息提高诊断准确性

抽象

早期筛查胰腺导管腺癌(PDAC)的预后具有显著提升效果,然而这一任务具有一定难度,因为该类病变通常体积较小且在增强计算机断层扫描(CE-CT)中界限不清。深度学习技术有助于提高PDAC的诊断准确度;然而目前仍面临无法识别小病灶(<2 cm)的挑战。本研究采用最先进的深度学习模型开发了一个自动检测框架,重点关注小病灶的识别,并探究了周围解剖结构整合的影响。研究利用119例经病理证实PDAC患者及123例无PDAC患者的CE-CT数据进行训练,以优化自动病变检测与分割模型(_nnUnet_T)。为评估解剖学整合效果,我们训练了两个独立的_nunet模型:(1)用于胰腺与肿瘤分割(_nnUnet_TP);(2)用于胰腺、肿瘤及周围解剖结构联合分割(_nnUnet_MS)。所有模型均采用了外部公开可用的独立测试集进行验证比较。结果显示,_nnUnet_MS表现最优,其在整体测试集上的受试者工作特征曲线下面积为0.91,针对<2 cm肿瘤的特异性检验曲线下面积为0.88,表明基于解剖学信息的高级深度学习方法能够有效提高PDAC的小病灶检测水平。

关键词:

胰腺导管的腺体癌症;深度学习技术;早期筛查]

1. 引言

胰腺导管腺癌 (PDAC) 是胰腺癌最常见的形式,其 5 年相对生存率仅为 10.8% [1,2]。胰腺癌的发病率正在增加,预计到 2030 年,胰腺癌将成为西方社会癌症相关死亡的第二大原因 [2,3]。在疾病早期诊断的患者,肿瘤较小(大小< 2 cm)且经常可切除,其 3 年生存率 (82%) 远高于肿瘤较大的晚期诊断患者 (17%) [4]。不幸的是,肿瘤很少在早期发现,大约 80-85% 的患者在诊断时表现为不可切除或转移性疾病 [1]。鉴于这些统计数据,很明显 PDAC 的早期诊断对于改善患者预后至关重要,因为逆转分期分布将使总生存期增加一倍以上,而无需进一步改善治疗 [5]。

早期PDAC的检测存在较大难度,在大多数患者病情进展到晚期之前往往不会出现特异性的症状表现。基于现有技术对普通人群进行筛查的成本较高[5,6])。此外,在计算机断层扫描(CT)中难以明确显示PDAC肿瘤特征[5]。这一问题在疾病早期阶段显得尤为突出,在病变尺寸小于2厘米的同时还常表现为等衰减性特征[7]。最近一项针对诊断前CT变化的研究表明,在临床诊断前18至12个月期间可以通过回顾性观察发现可疑的变化提示[8]。然而,在临床工作中能够识别这些变化并将其转诊至进一步检查的敏感度仅为约44%[8]

AI借助海量影像数据辅助肿瘤早期筛查。在医学影像分析领域中,尤其是卷积神经网络(CNN)这类图像分析专家,在基于影像的各种癌症诊断任务中展现出卓越的准确率[[9, 10, 11]]。CNN接收医学影像作为输入,并通过连续的应用卷积和池化操作自动生成与疾病诊断相关的特征。

该系统具备癌症检测能力,并能在阳性结果出现时实现病变定位,在通常情况下,用户无需进行交互操作

最近的研究引起了广泛关注关于深度学习模型在自动PDAC诊断中的应用 [12,13,14,15,16,17]。然而,在大多数研究中,默认的做法是将输入图像进行二元分类即将其划分为癌性和非癌性类别而未对病变位置进行分析。此外,在现有文献中很少涉及对早期病灶(尤其是小于2厘米的)的关注这一问题。尽管如此只有一项研究对此进行了深入分析并具体报道了大小小于2厘米肿瘤的表现 [15]。

在本研究中采用当前最先进深度学习架构以精准识别并定位PDAC病变尤其是针对直径小于2厘米的肿瘤亚组我们开发了一个完全自动化的深度学习框架该系统接收经腹超声断层扫描(CE-CT)图像作为输入并通过生成肿瘤概率评分及空间分布图来辅助诊断此外在评估现有临床路径中的解剖学知识整合对模型性能提升方面也进行了深入分析[7]为了全面评估系统的性能表现我们在外部独立获取的标准测试数据集上进行了验证同时针对直径小于2厘米的肿瘤亚组我们也进行了详细分析

2. 材料和方法

2.1. 数据集

本研究经机构审查委员会(荷兰奈梅亨拉德堡德大学医学中心CMO2016-3045方案版本3,2018年9月21日)批准,并经回顾性研究放弃了个体患者的知情同意。本研究选取了2013年1月1日至2020年6月1日期间获得的119例经病理证实胰头PDAC患者(PDAC队列)以及同期获配的正常胰腺患者(非PDAC队列),并基于这些患者的门静脉期CE-CT扫描作为模型开发的基础数据。

将两个公开可用的腹部CE-CT数据集整合用于验证模型:(1)取自美国纽约州曼哈顿的纪念斯隆凯特琳癌症中心的"医疗分割十项全能"胰腺数据集(MSD),该数据集基于281例胰腺癌患者(涉及头部、颈部、胰体及胰尾)构建了体素级注释[[18]]。(2)包含80例健康胰腺样本的"癌症成像档案"数据集及其对应的体素级注释[[19,20]]。

从肿瘤分割测量肿瘤的大小作为轴向平面上的最大直径。

2.2. 图像采集和标记

该CE-CT扫描系统由以下五台扫描仪组成:分别来自日本枥木县的东芝公司(Aquilion One)、德国福希海姆的西门子医疗保健集团提供的Sensation64与SOMATOM Definition AS+、德国的Brilliance64由Philips Healthcare供应、荷兰Best公司的1024×1024像素版本以及美国威斯康星州密尔沃基地区的GE Medical系统提供。该系统采用从大尺寸图像到小尺寸图像的降采样处理方法,在进入模型开发阶段前对原始数据进行预处理以符合统一的数据格式需求

所有来自PDAC队列的图像均通过ITK-SNAP 3.8.0软件由受过专业训练的医学院学生完成手动分割工作,并经经验丰富的腹部胰腺外科放射科医生进行核实与校准以确保数据质量

2.3. 自动 PDAC 检测框架

本研究采用基于分割的技术实现了对PDAC(原位腺癌)的自动检测与定位系统。
我们提出了一种创新性医疗图像分割框架——nnUnet(参考文献1),该框架具备高度自适应性并被集成到检测系统中。
这些系统均采用三维U-Net架构(参考文献1),并通过五轮交叉验证达到了稳定的训练效果。

从 PDAC 和非-PDAC 队列中自动提取胰腺周围的感兴趣区域(ROI)。建立解剖分割网络用于胰腺及其他结构的分割(参考上一节)。通过从 PDAC 队列的扫描数据中提取这些 ROI 作为训练样本。将该网络应用于非-PDAC 队列中的 ROI 生成标注,并将这些标注与人工标注的 PDAC ROI 进行对比。开发并训练三种 nnUnet 模型用于精确检测和定位 PDAC 病灶。每种模型配置均采用两种不同的初始化策略,并采用五折交叉验证的标准方法构建多轮模型。为了提高模型性能,在训练过程中分别使用交叉熵损失函数以及软 DICE 损失函数,并观察其对检测任务的影响效果[24,25]。此外,在微调阶段将来自完整 CE-CT 扫描的数据下采样至 256 × 256 的分辨率,并利用低分辨率胰腺分割网络完成对低质量图像中的胰腺 ROI 自动识别任务

在推理过程中对图像实施降采样操作随后利用基于低分辨率的胰腺分割网络获取初步分割结果将此初步蒙版信号经过上采样处理恢复至原始分辨率水平并通过膨胀操作减少现有空隙最终设定固定间距自动识别ROI区域这是前述PDAC检测模型所需输入数据

该提取的边际是基于PDAC队列所得交叉验证结果用于定义的,并且在执行ROI修剪操作时将不丢失相关信息。

所有 PDAC 检测系统(基于 nnUnet_T、nnUnet_TP 和 nnUnet_MS 的架构)均能生成体素级别的肿瘤概率图谱,在 nnUnet_TP 和 nnUnet_MS 的情况下还实现了胰腺组织层面的分割。这种组织水平上的分割被应用于后续处理阶段,在此过程中通过覆盖肿瘤置信度分布来降低非胰腺区域的假阳性结果,并最终限定仅关注胰腺区域能够实现PDAC 的预测分析。

经过后续处理后, 我们通过选取具有最大预测似然值的像素, 并包含所有与之相连且其似然值不小于40%的体素(在三维空间中), 从肿瘤概率图中依次提取候选PDAC病变区域。接着, 从模型预测结果中剔除这些候选病变区域, 并重复这一过程直至不再有候选病变区域或仅提取不超过5个病变区域。整个框架的工作流程最终确定的最大概率对应位置即为PDAC病变定位核心区域。

图 1 显示了从输入端原始图像到最终输出的肿瘤可能性评估结果的过程示意图

癌症 14 00376 g001 550

图 1. 提出的一种基于自适应学习率优化算法的新框架示意图概述。其中,在数据预处理阶段(Preprocessing stage),首先对原始数据进行标准化处理;随后在特征提取阶段(Feature extraction stage)利用改进型卷积神经网络对特征空间进行非线性变换;最后在分类预测阶段(Classification stage)结合多标签学习方法完成分类任务。

2.4. 分析

使用受试者工作特征(ROC)曲线对患者的水平表现进行评价的同时,则采用自由反应受试者工作特征(FROC)曲线来评价病变的表现。在ROC分析中,则通过绘制不同阈值下模型的真阳性率(即敏感度)与假阳性率(即1-特异性)的变化曲线来评估模型能否提供肿瘤的存在信心度。与此同时,在FROC分析中则会绘制出真阳性率与每个图像在不同阈值下的平均假阳性数目变化曲线以帮助判断模型是否能够准确地定位病变[26,27]。从肿瘤检测似然图中提取的所有3D候选病变对象中的最大置信度值均被用来生成后续的FROC分析数据集。如果一个候选病变对象的最大置信度值与真实病变体征之间的相似系数(基于所有提取到的候选病变体积与真实病变体积之间的三维对比计算得出)至少为0.1,则该候选病变对象就被判定为真阳性结果。值得注意的是,在其他类型的癌症疾病[10,28]中这一置信度阈值设定的标准同样适用于当前研究领域以解决组织级定位的临床需求问题,并且考虑到三维形态对象之间可能存在非重叠特性这一研究特点

为了对比三种不同的 PDAC 检测配置方法, 我们将每种配置下的10个训练模型分别应用于测试集. 然后通过10万次排列检验评估 ROC 曲线下面积 (AUC-ROC) 和 FROC 曲线下部分面积 (pAUC-FROC) 之间的显著差异, 并按照每个患者[0.001-5]假阳性率区间进行计算. 使用97.5%置信水平采用 Bonferroni 校正法评估统计显著性, 最终性能指标则基于集成这10个模型的预测结果得出

3. 结果

表 1 中汇总了 PDAC 队列中的患者临床特征信息。研究者在非 PDAC 队列中发现了一组患者的基线特征数据:其平均年龄为 (52.3 ± 21.4) 岁,在性别构成上显示出女性占总病例数的少数部分(共54例),而男性则占据较大比例(共69例)。

表 1. PDAC 队列患者的相关临床信息。其中数据主要呈现为均值±标准差或中位数(四分位间距)的形式。肿瘤分期分为以下阶段:I期——局部可切除;II期——临界可切除;III期——局部高级;IV期——转移。

临床特征
年龄 (岁) 69.2 ± 8.5
性别 (男/女) 67/52
肿瘤分期 (I/II/III/IV) 22/21/47/29
肿瘤大小 (cm) 2.8 (2.3–3.7)

表 2

表 2. 被用来计算 每个配置下的 AUC-ROC 和 pAUC-FROC 的平均值及其 95% 置信区间(95% CI) 的 内部五重交叉验证过程。

表 2 的 AUC-ROC 曲线下的区域及其 pAUC-FROC 曲线下的部分区域均计算了其平均值,并在95%置信区间的基础上进行了评估;这种评估方法适用于每种配置方案的内部五折交叉验证

配置 平均 AUC-ROC (95%CI) 平均 pAUC-FROC (95%CI)
nnUnet_T 0.963 (0.914–1.0) 3.855 (3.156–4.553)
nnUnet_TP 0.986 (0.956–1.0) 3.999 (3.252–4.747)
nnUnet_MS 0.991 (0.970–1.0) 3.996 (3.027–4.965)

图2比较研究显示,在外部测试集上平均计算得到ROC曲线及其对应的FROC曲线,并附带95%置信区间。该结果显示为通过10次独立训练(每次包括两次随机初始化和五折交叉验证)得到。实验结果表明,nnUnet_MS与nnUnet_TP均表现出0.89以上的AUC-ROC值,并且在病变检测方面通过统计学检验发现nnUnet_MS的表现显著优于其他两种模型(p值均小于10−4)。

图 2. 平均 ROC 和 FROC 曲线以及外部测试集的相应置信区间。

在MSD数据集中,肿瘤的中位值为2.5 cm(IQR为2.0-3.2)。其中,在该数据集中小于2 cm 的肿瘤占总样本的比例仅为73%。图3展示了这些较小肿瘤样本在不同配置下的患者水平评估指标及其病灶特征分布情况。具体而言,在患者层面分析时发现,在整个数据集上的平均AUC-ROC值较之于其他配置均显著下降(约减少约0.05)。研究进一步发现,在大多数情况下,默认超参数设置下三种模型均展现了较高的性能特征(具体而言,nnUnet_MSnnUnet_TP 的表现优于 nnUnet_T)。然而,在97.5%置信水平下,nnUnet_MSnnUnet_TP 的性能差异并未达到统计学显著性(分别为p=0.034和p=0.077)。此外,在病变水平评估方面,通过集成各配置下的10个模型预测系统所得出的结果表明,对于大多数测试用例而言,nnUnet_MS 均展现出显著的优势(具体而言,p<1e-4对于所有测试用例均成立)。

图 3. 主要评估 tumor subgroups with size < 2 cm 的平均 ROC 和 FROC 曲线及其外部集的相应置信区间。

表 3 的结果显示,在完整测试集合中以及尺寸小于2毫米的肿瘤亚组中对AUC-ROC和pAUC-FROC值进行了综合汇总。

子群 配置 AUC-ROC pAUC-FROC
整个测试数据集 nnUnet_T 0.872 3.031
nnUnet_TP 0.914 3.397
nnUnet_MS 0.909 3.700
肿瘤大小 < 2 cm nnUnet_T 0.831 2.671
nnUnet_TP 0.867 3.289
nnUnet_MS 0.876 3.553

图 4

癌症 14 00376 g004 550

图 4

4. 讨论

在本研究中,最新型的用于医疗分割的自适应配置架构nnUnet[22]被成功应用于开发一个完全自动化的管道系统,在CE-CT扫描中实现了对PDAC癌肿的精准识别和定位。此外,在整合周围解剖结构方面也进行了深入评估。

将深度学习应用于PDAC检测的主要障碍在于胰腺仅占腹部CE-CT扫描的一小部分而病变位于该区域内的靶点甚至更为有限。采用完整CE-CT扫描进行训练与测试不仅会带来巨大的资源消耗还会提供大量非必要的器官信息从而分散了模型的关注焦点使其难以专注于胰腺病变的位置这一问题亟待解决为此我们的PDAC检测框架首次采用了低分辨率nnUnet模型实现了对微小区域内的粗略胰腺分割并从全输入CE-CT扫描中自动生成所需的小体积感兴趣区域这一创新方法也是首个基于深度学习实现完全自动化的PDAC检测系统并通过外部验证证明了其有效性

早期的研究在 CT 扫描中采用深度 CNN 自动识别胰腺癌(PDAC)[参考文献 12 至 17]。然而,在外部验证集中仅两项研究证实了该模型的有效性[参考文献 15 和 16 ]。其中一项研究利用了公开可用的胰腺数据集进行验证。刘等[参考文献 15 ]开发了一种基于二维切片的深度学习模型以区分胰腺癌组织与非癌性组织。该方法要求先由专家对胰腺进行解剖学描绘随后由网络将其分类为癌性和非癌性斑块区域划分完成后则根据分类器内癌性斑块所占的比例判断肿瘤是否存在从患者层面来看该模型将肿瘤分为小于 2 cm 的亚组时其灵敏度达到了 0.631 (置信区间:0.502 至 0.747)。最近 ... 开发了一种端到端的胰腺恶性肿瘤诊断流程在外部测试集上表现出 AUC-ROC 为 0.871 的优异性能但目前尚未能在公开可用的数据集上进行验证

在外部测试集上达到了914的最大ROC-AUC值,在针对2厘米大小肿瘤亚组(其ROC-AUC值为)< 876的情况下表现优异。
这种性能水平与当前该测试数据集的最新技术相当[15],
但具备无需人工干预的优势。
此外,
我们的框架能够识别病变的位置,
从而使得分类结果具有直接可解释性,
因为它们直接来自网络对肿瘤的分割。
值得注意的是,
这些成果不仅为我们提供了新的基准指标[16],
而且显著优于S等人之前报告的最佳AUC-ROC值(0.871)。

本研究是首次评估多个周围解剖结构对深度学习模型性能影响的系统性研究,在胰腺癌检测方面具有重要意义。经 Contrast 超声 computed tomography(CE-CT)扫描中常表现为低对比度和模糊的边界。约 5.4%-14% 的肿瘤完全等衰减无法与正常胰腺组织区分开来[29]。这些等衰减肿瘤只能通过继发影像学表现(如胰管扩张)来识别,并且在疾病早期更常见[7, 29]。对于PDAC诊断和局部分期而言,在临床实践中周围的解剖结构发挥着至关重要的作用[7, 29]。然而目前深度学习模型仅关注肿瘤及非癌性胰腺实质,并未充分考虑周围所有解剖结构所提供的诊断信息

在这个框架中, 解剖信息被整合为 nnUnet_MS 模型的核心内容. 该模型经过训练不仅能够实现肿瘤与胰腺实质的分割,还能够处理其他相关解剖结构的分割任务. 其工作原理在于通过学习鉴别感兴趣区域中不同类型组织的存在, 使网络能够识别并建立各器官间的潜在关联关系,从而实现病变部位的精准识别. 在比较中, 该网络与 nnUnet_T 进行了直接对比, 而 nnUnet_TP 则专用于分割肿瘤与胰腺实质两部分, 其目标是评估添加周围解剖组织对整体效果的影响.

通过外部测试集的数据分析表明,在患者组别中与仅依赖肿瘤分割相比,nnUnet_TPnnUnet_MS 模型均显著优于 nnUnet_T 系统,其诊断性能得到了进一步提升(如图 2 和图 3所示)。值得注意的是,nnUnet_MS 系统在肿瘤区域的水平上表现更为突出,其融合了周围解剖结构的能力使其检测微弱病变的能力得到了显著增强(如图 4所示)。然而,nnUnet_TnnUnet_TP 模型由于无法有效区分肿瘤与健康的胰腺实质,导致对某些特定病理类型的检测能力不足。相比之下,nnUnet_MS 系统通过提供多结构分割信息,不仅能够准确识别病变的位置(如胰管扩张末端的位置),还能为放射科医生提供更为全面的解剖学参考信息

尽管结果值得期待但这项研究仍存在两大主要局限性:第一基于小样本的数据集构建解剖学模型可能导致外源性成像数据表现受限;第二该系统架构对异源性成像数据的支持尚不完善这可能限制其临床推广效果为此我们需要扩大训练数据集规模以涵盖更多患者类型包括非胰头部位的肿瘤以改善这一问题;第三当前系统架构在解剖分割网络的训练过程中面临较大的计算资源需求由于人工标注不同解剖结构的工作量较大为此我们采用了分阶段的人工标注策略即仅对PDAC相关图像进行了人工标注而其余部分则采用自学习算法进行自动分割这一策略虽然能在一定程度上减少工作量但也可能引入分类错误进而影响整体性能最终我们发现通过增加训练数据集规模可以在一定程度上缓解这些问题以提高模型对复杂病例的适应能力从而实现更高的自动注释质量

5. 结论

本研究开发了一种完全自动化且依赖深度学习的方法,该方法能够鉴别PDAC患者并精确定位病变区域于CE-CT扫描中。实验结果表明,所提出的模型在整体外验证数据集中最佳AUC值达到0.914,在2厘米病灶亚组中的性能降至<0.876,这表明当前最先进的人工智能系统在鉴别微小PDAC病变方面表现优异,并可能协助放射科专家更早诊断该疾病。尽管当前研究取得令人鼓舞的结果,但在实际临床应用前仍需通过更大规模、多中心的数据集进一步验证其适用性

6.交流与联系

点此跳转至文章末尾

全部评论 (0)

还没有任何评论哟~