文献速递:深度学习乳腺癌诊断---使用深度学习改善乳腺癌组织学分级
Title
题目
Improved breast cancer histological grading using deep learning
使用深度学习改善乳腺癌组织学分级
01
文献速递介绍
乳腺癌组织学分级已被普遍认可为一种重要的临床参数,在其分析过程中包含了三个关键指标:小管状结构的完整性程度、细胞核的状态多样性以及细胞分裂次数的数量统计。相较于仅依据单一指标(如患者的年龄、肿瘤体积或淋巴结转移情况)进行预测的方法而言,“组织学分级”能够同时评估形态特征及增殖能力,并因此展现出独特而显著的预测价值,在临床诊断决策中得到了广泛应用。其中应用最为广泛的分类体系为诺丁汉分期法(Napkin Ring Classification),这一系统由Elston和Ellis基于原有的Bloome Richardson分期体系进行了优化和完善,并已在多个研究群体中验证了其预测效能
较高的诺丁汉组织学评分(NHG)与其不良预后结果显著相关,并被视为实施更为激进治疗策略的重要依据;相反地,则表明了更低风险等级及更为审慎治疗方案的应用可能性。然而需要注意的是这类分层标准是由具有专业资质的专业人士根据组织学特征主观评断得出的结果;而这一过程往往伴随着较大的评估者间变异及不确定性。先前的研究发现表明,在识别最具侵袭性肿瘤(如NHG 3级)时检测系统的一致性更高;但在区分中等侵袭性肿瘤类型(如NHG 1级与2级)时其诊断一致性则有所下降
中间组(NHG 2)约占总患者群体的一半。尽管与NHG 1和3相比,在形态学模式和生存结果上呈现出更高的多样性。由于组织学分级在制定治疗方案时仍然占据核心地位,由此带来的异质性问题使得为每位患者制定最佳治疗方案成为一个复杂挑战。为此,已提出多种方法来应对这些不确定性问题,并以期有效减少过度治疗与不足治疗现象的发生。基因表达分型已被用来将中间风险肿瘤患者分为两类。然而,在分子诊断技术方面仍面临着高昂成本与耗时长等挑战。
中间组(NHG 2)约占总患者群体的一半。尽管与NHG 1和3相比,在形态学模式和生存结果上呈现出更高的多样性。由于组织学分级在制定治疗方案时仍然占据核心地位,由此带来的异质性问题使得为每位患者制定最佳治疗方案成为一个复杂挑战。为此,已提出多种方法来应对这些不确定性问题,并以期有效减少过度治疗与不足治疗现象的发生。基因表达分型已被用来将中间风险肿瘤患者分为两类,然而在分子诊断技术方面仍面临着高昂成本与耗时长等挑战
数字病理学的发展及其高分辨率全幅组织病理切片图像(WSIs)的常规获取模式,在标准临床工作流程中使得应用高级图像分析技术变得可行。随着人工智能技术的进步与突破,在组织病理学领域中运用深度学习算法进行图像分析也面临着前所未有的机遇与挑战。近年来,在检测与病理分类方面的研究取得了显著进展。其中一种基于深度学习的新方法——DeepGrade——被提出用于基于数字化苏木精和伊红(HE)染色后的WSIs进行乳腺癌组织学分级研究;该方法特别关注于优化针对NHG 2肿瘤预后分层的关键环节;通过开发NHG 1与NHG 3形态学特征分类模型,并在此基础上对NHG 2肿瘤样本进行重新分层评估;该模型已在独立内部测试数据集以及外部验证数据集上均取得了令人满意的实验结果
Results
结果
DeepGrade独立提供了内测集中NHG 2病例的分层信息,在校正已知风险因素后显示DG2高组复发风险显著高于DG2低组(HR 2.94, 95% CI 1.24-6.97, P¼0.015)。同时DG2低组在表型特征上与NHG 1相似,并与DG2高组具有NHG 3的特征表明该模型识别了NHG 2病例中与更侵袭性肿瘤相关的形态学模式。进一步评估模型在独立测试集中的外测效果证实了DG2高组复发风险显著高于DG2低组(HR 1.91, 95% CI1.11-3.29, P¼0.019)。
DeepGrade为NHG 2病例群提供了独立的预后预测,在内部测试集中的分析结果表明,在DG2-低风险组基础上建立的风险因素后,DG2-高危组显示出较高的复发风险(HR=2.94;95% CI [1.24,6.97];P=0.015)(独立测试数据)。此外,在该模型中观察到NGH 1具有高度相似性于DG2-低危组,在其表型特征上与NGH 3高度相似,则暗示该模型识别了NGH 2中与其相关的侵袭性肿瘤形态学特征。通过外部测试集进一步验证了DeepGrade在预后评估中的价值,并证实了其较高的复发预测能力(HR=1.91;95% CI [1.11,3.29];P=0.019)。
Methods
方法
In this observational retrospective study, standardized hematoxylin-and-eosin-stained WSI examinations from 1567 patients were systematically used for model optimization and validation purposes. Model generalizability was further assessed in an external test set comprising 1262 patients. The NHG-2 cases were divided into two groups: DG2-high and DG2-low, with their prognostic values evaluated separately. The overall recurrence-free survival rate achieved was 85.7%.
本研究采用了一种观察性和回顾性的方法,在1567例患者的常规组织学检查(使用苏木精与伊红染色)基础上开展模型优化与验证工作。其普适性通过包含1262例患者的新样本集进一步验证。将NHG分为两组:高风险分型组与低风险分型组,并对其预后价值进行了评估工作。最终结果显示无复发生存率为特征
Conclusions
结论
This introduced model-based classification framework for NHG 2 tumours exhibits significant prognostic potential and provides additional clinically-relevant data compared to conventional histological grading. This approach represents a cost-efficient alternative compared with molecular profiling for extracting pertinent clinical information. Key words: breast cancer, digital pathology, deep learning, artificial intelligence, histological grade_
开发了一种基于模型的NHG-2肿瘤患者的分层方法,并在此基础上增加了与临床相关的辅助信息。这种方法提供了一种高效且经济实用的替代方案,在分子分型方面应用广泛,并特别适用于提取对临床决策具有重要参考价值的信息
关键词:乳腺癌,数字病理学,深度学习,人工智能,组织学等级
Fig
图

_Figure 1. Comprehensive graphical summary detailing the optimization processes, application procedures, and evaluation steps involved in the DeepGrade model.
_After undergoing staining, histopathology slides from breast cancer surgical specimens were systematically scanned. The tumor regions were precisely segmented, and high-resolution image tiles were successfully extracted for further analysis. Patients with histologically graded tumors as per the Nottingham criteria (NHG) of grades 1 and 3 were selected to optimize the DeepGrade model, which is a sophisticated CNN ensemble comprising 20 base networks. Once optimized, this predictive model was then applied to re-stratify cases classified as NHG 2. Finally, time-to-event analysis was conducted to evaluate the prognostic performance of the system. DG refers to DeepGrade; WSI stands for whole-slide histopathology images; prognosis refers to predictive performance.]
图1。DeepGrade模型优化、应用和评估的示意概览。
从乳腺癌手术标本中获取的染色组织病理学幻灯片被扫描并获取图像数据。根据诺丁汉组织学分级(NHG)1级和3级的标准筛选肿瘤样本用于深度分级模型(DeepGrade)优化工作。该系统由20个基础模型组成并采用集成学习方法进行训练。随后将优化后的深度分级模型应用于NHG 2级病例重新分层分析工作。最后通过生存时间分析评估其在预后预测中的性能表现效果)。其中DG代表深度分级模型(DeepGrade),WSI为全幅组织病理切片图像(Whole Slide Image)。

图2展示了乳腺癌患者无复发生存曲线的数据分析结果及基于Deep分级重新分组后的牛津Histological分类(NHG)1-3级患者的Kaplan-Meier曲线图。(A)根据牛津Histological分类(1-3级)患者的Kaplan-Meier曲线显示:NHG 2组具有中等水平的生存状况;而NHG 3组则呈现出较差的预后结果。(B)针对Deep分级分型为DG2高表达组的Kaplan-Meier曲线显示:该组患者的预后情况较差。(C)进一步分析显示,在ER阳性患者群体中,基于Deep分级分型为DG2高表达组的患者的生存曲线呈现更差的趋势。(D)在ER阳性且淋巴结阴性的患者群体中进行进一步分析发现:与非节点阳性的ER阳性患者相比,在DG2高表达组中其生存曲线表现出更为显著的趋势
图2展示了通过DeepGrade重新分层后的乳腺癌患者的无复发生存情况。(A)图中展示了根据NHG 1至3级患者的Kaplan-Meier生存曲线;其中显示NHG 2组具有中等预后而NHG 3组预后较差。(B)图则进一步细化到通过DeepGrade重新分层后的NHG 2组别患者群体;结果显示其整体预后不如原始NHG分类中的该组别。(C)与(D)两部分分别聚焦于经雌激素受体阳性和淋巴结阴性两个亚群体中的患者;结果显示经过深度分级后两者的生存状况均较原始分类有所改善但仍然不如前者显著

Figure 3. Forest plots from multivariable Cox proportional hazard regression. (A) Results from multivariable Cox proportional hazard regression analysis of patients stratified by Nottingham histological grade (NHG) 1-3. NHG 2 was not significantly different from NHG 1, while the hazard ratio (HR) between NHG 1 and 3 was 3.74 (95% CI 1.12-12.55, P ¼ 0.033). (B) Results from multivariable Cox proportional hazard regression analyses of DeepGrade-re-stratified NHG 2 cases. The estimated HR between DG2-low and DG2-high was 2.94 (95% CI 1.24-6.97,P ¼ 0.015). (C) Results from Cox proportional hazard regression in the DeepGrade-re-stratified NHG 2 ER-positive subgroup (HR 3.21, 95% CI 1.32-7.79, P ¼ 0.010). (D) Results from Cox proportional hazard regression of the DeepGrade-re-stratified NHG 2 ER-positive and node-negative subgroup (HR 3.03; 95% CI 0.91-10.10, P ¼ 0.071). All Cox proportional hazard models were adjusted for age, tumour size, lymph node metastases, ER status and HER2 status. CI, confidence interval; DG, DeepGrade; ER, estrogen receptor; HR, hazard ratio.
图3。多变量Cox比例风险回归的森林图。
(A) 通过采用诺丁汉组织学分级(NHG)1-3分层的患者数据进行多变量Cox比例风险回归分析显示:与NHG 2分层病例相比,NHG 1分层病例间未见显著差异;但与NHG 1分层病例相比,在NHG 3分层病例中观察到更高的风险比(HR),其值为3.74(95%置信区间为1.12至12.55;P = 0.033)。(B)DeepGrade对重新分层NHG 2病例开展多变量Cox比例风险回归分析后发现:DG2-低组与DG2-高组之间的风险比(HR)为2.94(95%置信区间为1.24至6.97;P = 0.015)。(C)DeepGrade重新分层NHG 2且ER阳性的亚组进行Cox比例风险回归分析结果显示:其风险比(HR)为3.21(95%置信区间为1.32至7.79;P = 0.010)。(D)通过对DeepGrade重新分层NHG 2、ER阳性且淋巴结阴性亚组的数据进行Cox比例风险回归分析得出:该亚组的风险比(HR)为3.03(95%置信区间为0.91至10.10;P = 0.071)。所有Cox比例风险模型均基于年龄、肿瘤大小、淋巴结转移情况、ER状态及HER2状态进行了多因素校正。CI:置信区间;DG:DeepGrade;ER:雌激素受体;HR:风险比

Figure 4 illustrates the Ki67 scores and their spatial distributions across the intrinsic subtype and the spatial distributions of the NHG subcomponents in the low-DG2, high-DG2, and subgroup patient groups.
(A) 小提琴图显示Ki67值的分布(仅在ClinSeq-BC中提供数据)。与NHG 1相比(P=2.80×10^-3, Mann–Whitney U检验),DG2-low组与DG2-high组之间存在显著差异(P=2.94×10^-4, Mann–Whitney U检验)。DG2-low组与DG2-high组之间未发现显著差异(P=0.625, Mann–Whitney U检验)。(B)内在亚型分布情况如下:DG2-low组与NHG 1组相似(主要为乳头状A型(P=0.618, Fisher's精确检验)。与DG2-low相比,DG2-high组具有更高的HER2阳性率及基底型比例。NHG 3组的亚型分布与DG2-high组存在显著差异(P=2.20×10^-16, Fisher's精确检验)。(C)针对细胞分裂计数、核形态及管状形成等指标,三个NHG亚群得分间的分布存在显著差异只有细胞分裂计数方面的得分间存在显著差异(P=6.54×10^-3, Fisher's精确检验)。术语解释如下:基底状;基底样状;深级;HER₂丰富;乳头状A;乳头状B;NOTtingham组织学分级(NHG).
图4展示了不同亚组中Ki67指标、固有亚型分布以及NHG亚组分数的分布情况。(A)小提琴图直观呈现了Ki67指标在ClinSeq-BC中的应用情况。通过统计检验发现:与DG2-低组相比(P = 2.80 × 10^-3),DG1与DG2-高组间存在显著差异(Mann-Whitney U检验);而与DG2-高相比(P = 2.94 × 10^-4),DG1与NHG3组间差异同样显著(Mann-Whitney U检验)。此外,在DG2-低与DG2-高两组之间并未发现统计学意义显著的不同(P = 0.625)。(B)进一步分析固有亚型分布情况:DG2-低组与DG1组呈现相似性,在大多数病例中表现为Luminal A类型(P = 0.618)。相比之下,在DG2-高组中HER2和基底样类型的病例比例更高,并且其固有亚型分布与DHG3存在显著差异(P = 2.20 × 10^-16)。 (C)最后观察到三个NHG亚组在涉及细胞周期计数、核多态性和管状结构方面的分数分布存在显著差异:只有细胞周期计数这一指标在DG2-低和DG2-高两组间显示出显著差别(P = 6.54 × 10^-3)。其中,“Basal”表示基底样,“Her2”表示HER₂富集性类型,“LumA”代表Luminous A类型,“LumB”代表Luminous B类型,“NHG”指诺丁汉组织学分级系统。“

_Figure 5. 鳄鱼状无死亡生存结果由外测数据集中的乳腺癌患者根据Nottingham组织学分级法与DeepGrade重新分类NHG-2患者分析得出。(A) 根据Nottingham组织学分级(1至3级),Kaplan-Meier曲线显示NHG-2组介于两者之间。(B)DeepGrade重新分类NHG-2病例组别中DG-高分组较DG-低分组显著早逝。(C)外测数据集中基于DeepGrade重新分类的NHG-2雌激素受体阳性病例群的Kaplan-Meier曲线。(D)外测数据集中基于DeepGrade重新分类的NHG-2雌激素受体阳性且去向阴性病例群的Kaplan-Meier曲线。
图5. 基于诺丁汉组织学分级体系以及通过DeepGrade进行优化重组后的NHG 2级患者的外部验证集中对乳腺癌患者群体的无复发生存预后研究。
根据受试者按照NHG分为1至3级所绘制的Kaplan-Meier曲线显示:其中NHG 2级别的患者具有中等生存率,在整体预后上表现优于其他等级;而经过本研究团队采用的新方法(即DeepGrade)对这些数据进行再分类后发现:与DG2低风险组相比,在经过深度重构后的新数据中(即DG2高风险组),其预后表现显著较差;进一步地,在外部测试集这一更大样本量的数据集中:采用新方法对具有ER阳性特性的特定亚群进行分析时(即深度重构后的该亚群),显示出比常规方法更好的诊断效果;而在具有ER阳性特征的同时又排除了淋巴结转移这一因素(即深度重构后的该特定子群)时,则显示出比常规方法更好的诊断效果。

Figure 6 presents forest plots generated from multivariable Cox proportional hazard regression analysis within an external test set.(A) All patients were stratified according to their routine NHG scores of 1-3.(B) Cases with an NHG score of 2 were divided based on their DeepGrade classification.(C) Patients belonging to both the NHG score 2 and ER-positive subgroups were categorized using DeepGrade.(D) Patients classified under the NHG score 2, ER-positive, and node-negative subgroups were further subdivided using DeepGrade.DG denotes DeepGrade; ER refers to estrogen receptor status; NHG represents Nottingham histological grade.
图6。外部测试集中基于标准NHG 1-3对全部患者的多变量Cox比例风险回归分析结果以森林图形式呈现。(A)基于常规NHG 1-3将所有患者进行分类。(B)采用DeepGrade方法将NHG 2病例进行细分。(C)基于DeepGrade划分NHG 2亚组中的ER阳性患者。(D)采用DeepGrade对NHG 2、ER阳性且淋巴结阴性亚组的患者进一步细分。DG代表DeepGrade;ER代表雌激素受体;NHG代表诺丁汉组织学分级。
