Advertisement

使用人工智能在乳腺癌筛查中的早期影响指标| 文献速递-AI辅助的放射影像疾病诊断

阅读量:

Title

题目

The Critical Factors Influencing the Effectiveness of AI-Driven Approaches in Enhancing Breast Cancer Detection

使用人工智能在乳腺癌筛查中的早期影响指标

01

文献速递介绍

基于人群的乳腺癌筛查借助乳房X线摄影技术有效地降低了乳腺癌的死亡率;然而这给乳腺放射科医生带来了巨大的工作压力。乳腺放射科医生必须处理大量乳房X线片,在这些影像中通常没有明显的可疑病变或需要召回的迹象。为了提高癌症检测效率并减少误诊导致的召回情况一些筛查项目采用了双重检查的方法;这种方法虽然提高了准确性但显著增加了工作负担。此外定期回访以进行进一步诊断的工作也加重了放射科医生的工作负担这种额外的工作压力由于乳腺专科放射科医生数量不足而变得更加突出。

近年来回顾性研究表明在使用人工智能辅助进行乳腺癌筛查时可帮助缓解放射科医生的工作压力同时又能维持检查效率。一项研究建议对于由AI系统认为可能正常的检查结果进行一次阅读而不是两次阅读能够有效减轻放射科医生的工作负担同时又能维持检出率特异性并降低误诊率。基于这些最新证据以及日益加重的放射科医生工作负荷AI系统作为一种辅助工具根据乳腺癌发生概率对 screening 实施分级管理可能是有实用价值的这也促使研究人员进一步探索将其应用于基于人群导向的 breast cancer screening 中

此外,在AI辅助决策支持系统及病变特征识别的支持下,让放射科医生阅读乳房X线片可能会有助于提升乳腺癌筛查的敏感度。同时将AI应用于乳腺癌筛查的分级筛选及辅助决策中不仅有助于维持乳腺癌早期发现的能力还能优化乳腺癌早期诊断的效果

Background

背景

Recent retrospective studies have indicated that the application of artificial intelligence technology could potentially reduce the workload assigned to radiologists while maintaining the effectiveness of mammography screenings.

基于回顾性研究的结果表明,人工智能技术的应用可能有助于减轻放射科医生的工作负担,并且同时能够维持乳腺癌筛查的效果。

Method

方法

This retrospective study included 50–69-year-old women who underwent biennial mammography screening in the Capital Region of Denmark. Before AI system implementation (October 1, 2020, to November 17, 2021), all screenings involved double reading. For screenings conducted after AI system implementation (November 18, 2021, to October 17, 2022), likely normal screenings (AI examination score ≤5 before May 3, 2022, or ≤7 on or after May 3, 2022) were single read by one of 19 senior fulltime breast radiologists. The remaining screenings were read by two radiologists with AI-assisted decision support. Biopsy and surgical outcomes were retrieved between October 1, 2020, and April 15, 2023, ensuring at least 180 days of follow-up. Screening metrics were compared using the χ2 test. Reading workload reduction was measured as saved screening reads.

这项回顾性研究涵盖了丹麦首都地区接受定期乳腺癌筛查(每两年一次)的50至69岁女性群体。在实施AI辅助诊断系统之前(即2020年10月1日至2021年11月17日),所有检查均采用双读法以提高准确性。自系统正式运行以来(即从2021年11月18日起至2022年10月17日),医生们对可能正常的检查进行了分类处理:对于完成于或早于2022年5月3日的检查(其中AI评分≤5),则由经验丰富的乳腺科医生独立完成;而对于晚于该日期的检查(其中AI评分≤7),同样由资深专家负责解读。其余未达到标准检查要求的病例则由两名放射科医生结合AI辅助工具共同完成解读工作。所有活检和手术样本均来自从2020年10月1日至2023年4月15日期间收集的数据,并保证每位受试者均接受了至少持续至第十八十天的随访观察。为评估系统的有效性和效率差异,在分析过程中将使用卡方检验方法进行比较分析,并通过减少需要进行的筛查阅读次数来衡量工作量的变化。

Conclusion

结论

In a population-based mammography screening program, leveraging artificial intelligence technology significantly decreased the total workload burdened by breast radiologists while enhancing the accuracy and efficiency of breast cancer detection processes.

基于人群分析的乳腺癌筛查项目中,在线部署人工智能(AI)系统能够有效降低乳腺放射科医生的工作负担,并显著提升乳腺癌筛查的效果

Results

结果

In total, 60751 and 58246 women were screened before and after AI system implementation, respectively (median age, 58 years [IQR, 54–64 years] for both cohorts), with a median screening interval before AI of 845 days (IQR, 820–878 days) and with AI of 993 days (IQR, 968–1013 days; P < .001). After AI system implementation, the recall rate decreased by 20.5% (3.09% before AI [1875 of 60751] vs 2.46% with AI [1430 of 58246]; P < .001), the cancer detection rate increased (0.70% [423 of 60751] vs 0.82% [480 of 58246]; P = .01), the false-positive rate decreased (2.39% [1452 of 60751] vs 1.63% [950 of 58246]; P < .001), the positive predictive value increased (22.6% [423 of 1875] vs 33.6% [480 of 1430]; P < .001), the rate of small cancers (≤1 cm) increased (36.6% [127 of 347] vs 44.9% [164 of 365]; P = .02), the rate of node-negative cancers was unchanged (76.7% [253 of 330] vs 77.8% [273 of 351]; P = .73), and the rate of invasive cancers decreased (84.9% [359 of 423] vs 79.6% [382 of 480]; P = .04). The reading workload was reduced by 33.5% (38977 of 116492 reads).

共计60751名女性在AI系统实施前接受了筛查,58246名女性在AI系统实施后接受了筛查(两组的中位年龄均为58岁[IQR,54–64岁]),AI实施前的中位筛查间隔为845天(IQR,820–878天),AI实施后的中位筛查间隔为993天(IQR,968–1013天;P < .001)。AI系统实施后,召回率下降了20.5%(AI前为3.09%[60751中的1875],AI后为2.46%[58246中的1430];P < .001),癌症检出率上升(0.70%[60751中的423] vs 0.82%[58246中的480];P = .01),假阳性率下降(2.39%[60751中的1452] vs 1.63%[58246中的950];P < .001),阳性预测值增加(22.6%[1875中的423] vs 33.6%[1430中的480];P < .001),小癌症(≤1 cm)率增加(36.6%[347中的127] vs 44.9%[365中的164];P = .02),无淋巴结转移的癌症率保持不变(76.7%[330中的253] vs 77.8%[351中的273];P = .73),浸润性癌症率下降(84.9%[423中的359] vs 79.6%[480中的382];P = .04)。阅读工作量减少了33.5%(116492次阅读中的38977次)。

Figure

图片

Figure 1: Flow diagram illustrating the inclusion and exclusion criteria for a cohort of women undergoing breast cancer screening, comparing results prior to and post-AI deployment in an artificial intelligence-based system.

图1:流程图展示了对女性乳腺癌筛查项目的纳入标准与排除标准进行系统性检查的过程。(A)在未应用人工智能(AI)技术之前进行的常规检查;(B)在引入AI技术后用于辅助乳腺癌早期发现的新型检查方式

图片

Figure 2: 流程图展示了在引入人工智能(AI)系统之前(B)和之后(C),其中(B)使用原始标准(May 3, 2022之前),而(C)采用了提高的标准进行单次检查筛选。绿色方框标记单读检查中正常检查结果;黄色方框标记了采用AI辅助双读检查的案例,在这种情况下放射科医生(*)能够借助AI系统提供的提示辅助诊断。neg.= 负性结果, pos.= 正性结果.

图2:图表展示了乳腺癌检查方案 (A) 在未引入人工智能(AI)系统时的状态以及 (B, C) AI系统应用后的状态。其中 (B) 表示基于传统筛检标准(截至2022年5月3日),(C) 则是采用更高标准进行筛检的选择性复查。绿色方框代表正常筛检结果并作为单次检查处理;而黄色方框则标记为采用AI辅助双重复查的情况,在这种情况下,放射科医师可借助AI提供的高亮病变提示来辅助诊断决策。阴性结果记作neg. ,阳性结果记作pos. 。

图片

Figure 3: 癌症检出率在Breast Imaging Reporting and Data System (BI-RADS)密度类别中的分布情况由第二位资深影像科医师完成分类。误差棒表示95%置信区间.= P < .05.AI定义为人工智慧, ns表示不显著.

本研究通过不同乳腺影像报告分类系统(BI-RADS)对密度级别的癌症检出率进行评估,并由经培训认证的高级放射科医师进行二次评估以确保结果的一致性。其误差棒代表95%置信区间,并标示P值小于0.05的结果具有统计学意义。其中AI代表人工智能技术应用 ns表示无统计学意义

图片

_Figure 4: A 67-year-old woman with a breast imaging density of 1 underwent screening using an AI-based digital mammogram. (A) The image shows AI-guided markings (squares). The AI system achieved a high score of 10, assigning 85/100 points to the region showing arterial calcifications. (B) This same image was reviewed by two radiologists following the high AI score. Their thorough analysis confirmed that the circled area with arterial calcifications did not raise any suspicion for breast cancer, leading to no further diagnostic evaluation required.]

图4展示了67岁女性左侧内外斜位全视野数字乳腺X射线图像,在满分100分的情况下获得85分。

图片

_Figure 5: 图片来自一位62岁女性患者,在接受人工智能(AI)辅助系统进行乳腺筛查时其乳腺组织密度值达到1的标准报告中她接受了AI系统评估得到较低分值(2分)因此由经验丰富的高级radiologist执行了单一读片检查.AI系统未能发现任何可疑病变.(A)右侧mediolateral正视图下的全场数字乳腺摄影显示标记为A1的可疑病变由高级radiologist识别.(B)前一轮检查时该病变并未可见.研究期间切片切口处病灶外观发生了明显变化导致误诊.(C)截取的超声图像显示一条约25毫米长的侵袭性乳腺导管癌用线标记这是诊断过程中所观察到的结果.

图5展示了某位62岁女性乳腺影像报告及数据系统密度值为1的情况,在人工智能辅助系统下进行检查。通过AI辅助检查获得了2分的低评分结果(即低AI水平),因此由经验丰富的放射科医生进行了单独分析。AI系统未能识别出任何可疑病变特征。(A)右侧内外斜位全视野数字乳腺X线片显示在A1位置发现了一位经验丰富的放射科医生标记的可疑病变。(B)在之前的筛查周期中未能发现这一病变。(C)经本次研究复查后发现组织外观发生了显著变化

图片

_Figure 6: Images from a woman whose breast tissue density, measured via the Breast Imaging Reporting and Data System (BIRADS), was 2, and who underwent screening using an AI system at age 57. (A) Radiological assessment showing AI-guided markings (rectangular box). The evaluation achieved a perfect score of 10 for this lesion, which was scored at an impressive accuracy rate of 89%. (B) Corresponding findings identified by human radiologists. Due to the flawless evaluation by the AI system, the case required dual review by two radiologists. Both reached identical conclusions regarding the lesion marked as (A1), thereby confirming its presence. This dual reading ensured accurate diagnosis. (C) Ultrasound examination revealed a small (<4 ×7 mm) minimally invasive carcinoma that was identified during diagnostic workup

图6展示了57岁一位乳腺影像报告及数据系统密度为2的女性乳腺影像报告及数据系统密度为2的情况。(A)右侧内外斜位全视野数字乳腺X线片显示了AI提供的标记(方框)。由于病变评分为89分(满分100),该筛查在AI检查中获得了10分的高评分。(B)与(A)相同的图像但显示了放射科医生发现的结果。由于该筛查获得了高AI检查评分两名放射科医生进行了双重阅读并标记了与AI系统相同的病变(椭圆形A1)导致患者被召回。(C)裁剪后的超声图像捕捉到了诊断过程中观察到的小型侵袭性癌其形态特征包括大小约为4×7毫米并带有线状增强特征

Table

图片

Table 1: Overview of Patient Cohort Profile Prior to and Following the Introduction of an AI System for Mammography Screening

表1:乳腺癌筛查中AI系统实施前后队列特征总结

图片

Table 2: Screening Performance Indicators

表2:筛查性能指标

图片

表3: 不同定义下潜在正常筛选的表现性指标

表3:不同定义的可能正常筛查的筛查性能指标

图片

Table 4: CDRs before implementation and after AI-based System Integration during Various Screening Periods

表4:不同筛查间隔下AI系统实施前后的癌症检出率(CDRs)

全部评论 (0)

还没有任何评论哟~