Advertisement

Pseudo Label-Guided Data Fusion and OutputConsistency for Semi-Supervised Medical Image 阅读

阅读量:

这篇论文提出了一种名为PLGDF的半监督医学图像分割框架,结合了平均教师网络和伪标签策略。通过数据增强、伪标签生成、多尺度一致性以及交叉熵损失等方法,论文展示了该框架在多个医学图像数据集上的有效性。尽管取得显著成果,但仍有以下问题值得进一步探索:
伪标签的稳定性:伪标签的生成可能引入错误信息,尤其是在数据分布不匹配的情况下。如何确保伪标签的准确性,避免对模型性能产生负面影响,是一个值得研究的方向。
多尺度一致性实现细节:论文提到通过在不同尺度上进行对比来加强模型的适应能力,但具体实现方式和效果如何,仍需进一步探讨。此外,多尺度一致性在不同任务中的适用性是否一致,也是一个值得深入研究的问题。
教师网络更新的可行性:论文使用指数移动平均线来更新教师网络,但在实际训练中,如何高效地实现这一过程,以及其对模型训练速度和效果的影响,仍需进一步验证。
模型的泛化能力:论文提到PLGDF框架在不同数据集上表现一致,但模型在特定任务中的泛化能力如何,是否需要针对不同任务进行参数调整,仍需进一步研究。
损失函数的平衡:论文提到的损失函数包括交叉熵、Dice损失和多尺度一致性损失,如何在不同任务中合理平衡这些损失,调整权重以获得最佳效果,仍需进一步探讨。
评估指标的临床价值:论文除了Dice分数,还使用了Jaccard指数、平均表面距离和95% Hausdorff距离等指标,但这些指标在医学图像分割中的临床应用价值如何,是否需要引入更多临床相关的评估指标,仍需进一步研究。
总的来说,尽管PLGDF框架在半监督医学图像分割中表现出色,但在实现细节和实际应用中仍有许多值得深入探索的问题。未来的工作可以进一步优化伪标签生成机制、深入研究多尺度一致性实现方式、探索模型在特定任务中的泛化能力,并引入更多临床相关的评估指标,以提升模型的实用性和临床价值。

[2311.10349] Pseudo Label-Guided Data Fusion and Output Consistency for Semi-Supervised Medical Image Segmentation (longhoe.net)

出乎意料地比 axios的性能指标更优,我认为这得益于其简洁的设计和高效的代码。

code:[ortonwang/PLGDF(GitHub存储)](https://github.com/ortonwang/PLGDF "ortonwang/PLGDF (GitHub存储))

摘要

医学图像分割,半监督学习,伪标签

I. INTRODUCTION 介绍

分割是医学图像处理与分析领域的一项基础任务[1]。临床医学中准确的图像分割为临床医生提供有价值的辅助信息,促进快速、准确、高效的诊断决策[2]。然而,手动标注感兴趣的区域非常耗时,并且依赖于医生的临床专业知识,导致大量的工作量和潜在的错误[3]。随着深度学习的快速发展,卷积神经网络(CNN)及其变体在计算机视觉任务中展示了强大的图像处理能力。全卷积网络[4]和U-Net[5]的引入极大地推动了自动图像分割[6]的发展。在此基础上,出现了许多进一步提高分割算法性能的研究[7][8][9]。例如,Ning等人提出了SMU-Net[10],该方法通过考虑背景中存在的纹理信息,利用显著背景表示来辅助前景分割。Pang等人引入了一种名为SpineParseNet的新型两阶段框架,用于在体积磁共振图像中自动解析脊柱[11]。此外,Chen等人提出了TransUNet[12],将CNN与Transformer[13]相结合用于医学图像分割,表现出色。然而,这些方法的成功在很大程度上依赖于大量的像素级标注数据,这只有通过熟练的医疗专业人员进行精确的标注才能实现[14]。这个过程既耗时又昂贵,限制了监督学习方法的适用性。为了解决这个问题,研究人员提出了基于半监督学习的医学图像分割方法[15]。与监督学习相比,半监督学习可以充分利用未标记数据中包含的信息,从而提高分割模型的泛化能力和准确性[16]。半监督学习的一种常见方法是使用伪标签策略。该方法通常使用标记数据来训练初始模型,然后将其应用于未标记数据以生成伪标签。这些伪标签作为未标记数据的近似标签,从而扩展了标记数据集。随后,使用扩展的数据集对模型进行再训练以提高其鲁棒性[17][18]Qiu等人引入了一种联邦半监督学习[19]方法来从分布式医学图像域学习,并为未标记的客户端引入了一种联邦伪标记策略,以减轻未标记数据中注释的不足。Bai等人提出了一种基于伪标记的迭代学习方法用于心脏MR图像分割[20]。该方法使用条件随机场对伪标签进行细化,并利用更新后的伪标签进行模型更新。半监督学习的另一种常见方法是基于一致性的方法[21]。该方法旨在结合未标记数据之间的一致性来增强模型的鲁棒性。在图像分割任务中,一致性可分为数据级一致性和模型级一致性。数据级一致性要求模型对同一图像的不同扰动产生一致的预测。例如,当对输入图像引入轻微的扰动或应用不同的数据增强技术时,模型应该产生相同的分割结果。另一方面,模型级一致性要求对相同输入的不同模型进行一致的分割结果。深度对抗训练[22][23]也是一种常用的方法,它通过使用判别器来对齐标记和未标记数据的分布,从而利用未标记数据。Wu等人介绍了MC-Net[24],它包括一个共享编码器和多个略有不同的解码器。该模型结合了解码器之间的统计差异来表示模型的不确定性并强制一致性约束。此外,均值-教师模型[15]及其扩展[25][26][27]在半监督医学图像分割任务中得到了广泛关注。在平均教师模型中,在训练过程中,学生网络的参数以教师网络为指导。模型训练包括最小化师生模型之间的误差。此外,其他算法在该领域也表现出了出色的性能。Luo等人提出了不确定校正金字塔一致性URPC[28],这是一种新的不确定校正金字塔一致性正则化框架。该框架提供了一种简单有效的方法来强制不同尺度的未标记数据的输出一致性。虽然框架简单有效,但其性能仍有进一步优化的空间,这表明这些方法的性能有进一步改进的潜力。因此,本研究也试图探索一些综合策略来提高半监督学习算法的性能。我们提出了一个新的框架,称为伪标签引导数据融合(PLGDF)。本文的主要贡献可以总结如下:•我们介绍了PLGDF框架,这是一个建立在平均教师网络上的新架构,包含了一个创新的伪标签利用方案。该框架在网络的解码器模块中集成了跨各种尺度的一致性评估。

混合模块整合了标记数据与未标记数据,从而丰富了数据集的多样性。同时,融合锐化技术显著提升了识别精度。

实验表明,相较于六个现有的模型,我们提出的方法在半监督医学图像分割任务中,在三个公开获取的数据集上表现出了显著优势,并树立了新的性能标杆。

II. RELATE WORK 相关的工作

A.医学图像分割

深度学习的进步在语义分割任务中带来了显著的进步。在医学图像分割领域,U-Net及其衍生方法已经成为常用的基准方法。基于U-Net的创新研究不断涌现,如CE-Net[29]、UNet++[30]、V-Net[31]等高性能算法,并且引入了3D U-Net[32],扩展了医学图像分割的应用领域到三维空间。Cao等研究者提出了swan-unet[33],通过替换SwinTransformer块来增强特征提取能力,而Wang等研究者则提出了O-Net[35],通过更深层次地融合CNN和Transformer来提升算法性能。此外,UNeXt[36]、SpineParseNet[11]和SegFormer[37]等方法也为模型优化做出了重要贡献。然而,这些方法主要采用了全监督学习的方式进行构建,其性能受限于可用于标注的训练样本数量的不足。

B.半监督医学图像分割

针对医学图像分割中标注数据量有限的问题,研究者们开发出多种半监督学习方法。其中,最显著的创新是将平均教师框架扩展至多维度应用。例如,Li团队提出了TCSM[25],该方法通过在未标注数据上施加多种扰动,并引入正则化手段,增强了预测一致性,从而训练出更优的网络模型。随后,我们团队提出了不确定性感知平均教师(UA-MT)[38],该方法通过设计一种不确定性感知方案,确保在不同扰动下对相同输入产生一致预测,进一步提升了模型性能。此外,Chen团队提出了基于对抗网络的增强平均教师框架[23],该方法能够有效区分标注与未标注数据,并展现出卓越的分割性能。在任务一致性研究领域,Luo团队提出了双任务深度网络方法[18],通过联合预测像素分割图和几何对象的分层表示,并引入双任务一致性正则化,显著提升了分割精度。伪标签[39]方法作为一种经典的半监督学习框架,通常通过锐化函数或固定阈值将概率预测转化为伪标签。在此基础上,Li团队提出了自循环不确定性策略[40],该方法通过自监督任务对神经网络进行循环优化,为未标注图像生成真值标签,从而实现了分割精度的提升。Rizve团队[40]则提出了统一概率与不确定性阈值的伪标签选择方法。最后,我们团队提出了URPC方法[28],该方法基于相同输入的不同尺度输出一致性,利用模型内部数据金字塔的一致性和不确定性校正机制,在半监督学习中实现了卓越的分割效果。在此研究基础上,我们将伪标签与金字塔一致性策略与平均教师框架相结合,进一步提升了医学图像的半监督分割性能。

如图1所示,本文提出的PLGDF框架的结构示意图。图的右下方部分展示了学生网络的详细描述。其中,Di代表V-Net主干网络的解码器模块,这些预测结果分别来自骨干网在不同尺度层的输出。通过多尺度上采样和卷积操作,这些预测结果被整合为统一尺寸的空间表示。此外,通过指数移动平均机制(EMA),教师网络实现了对来自学生网络参数更新的同步。

III. METHODS 方法

为了更全面地理解我们提出的模型,我们首先阐述了在解决半监督分割问题时所采用的符号体系。具体定义如下:Xl代表标记数据集,其中每个样本与对应的Ground Truth配对,标记为GT;Xu代表未标记数据集,由原始数据集中未附带GT的样本构成;Xmix是在训练过程中,通过Mix Module将Xu和Xl的数据进行混合。Fθs(x)表示输入x后生成的概率图,其中θs为学生网络的参数;Fθt(x)则为教师网络生成的概率图。

A. Overall architecture design 总体建筑设计

图1展示了我们研究中提出的PLGDF框架的整体架构。在我们的方法中,我们采用了平均教师模型框架,其中教师网络通过指数加权平均(EMA)实现对来自学生网络的参数更新。在算法1中,我们提供了一个伪代码来说明所提出框架的训练过程。首先,我们对Xu进行了双随机噪声增强。教师网络处理增强后的数据,得到平均结果后进行二值化处理,生成与Xu对应的伪标签。接着,我们利用Mix模块将Xu与Xl进行扩充,得到Xmix,如图1所示。最后,我们将Xu、Xl和Xmix进行组合,然后由学生网络处理以生成相应的预测结果:fθs(Xu)、fθs(Xl)和fθs(Xmix)。随后,我们通过应用锐化过程进一步细化fθs(Xu),以获得更精确的软伪标签。

为了方便模型的训练,我们对基于Xl的fθs、Xmix的fθs以及Xu的fθs分别进行了Lsup、Lsemi和Lsharp的评估。此外,我们增加了骨干模型的多尺度输出,并引入了一个多尺度一致性评估模块来评估不同尺度输出的一致性,如图Lconsis所示。在后续部分,我们将详细阐述每个模块。

B. Mix Module Mix模块

在有限数据环境下,通过增强模型的有效性来提升其鲁棒性。我们参考了视觉任务中广泛采用的mixup方法,引入了一种数据增强技术[41]。通过结合Xl和Xu,我们实现了数据混合过程,从而获得了更加多样化的训练数据集。对于样本对Xu1和Xl1,该过程可用数学表达式表示为:

图2所示。混乱的渲染。

其中α被随机生成为一个超参数。通过图2可以看出,图像混合的效果主要基于未标记图像,而带有标记的图像则提供了额外的混合。在混合操作后,未标记图像的信息发生了一定程度的改变,尤其是在图2所示的红色矩形框区域,这种改变更为显著。值得注意的是,这些变化并未显著影响图像的整体语义信息。基于此,我们在构建混合数据集时,采用了与未标记图像对应的伪标签作为标签。

C. Pseudo label sharpening 伪标签锐化

考虑到一致性在利用未标记数据方面的有效性,我们采用锐化函数[42]将fθs (Xu)转换为软伪标签,这些软伪标签是通过学生网络从Xu得到的结果。锐化函数的表达式如下:

其中,T被定义为调节锐化温度的超参数。从图3的可视化结果可以看出,锐化操作显著提升了分割边界在视觉上的清晰度和准确性,具体表现为边缘区域的模糊程度得到了明显降低,尤其是在图3所示的红色箭头所指的区域。这种改进方法能够更有效地捕捉目标边界及其细微结构特征。随后,我们基于fθs (Xu)和f∗θs (Xu)计算一致性损失函数。在软伪标签的监督下,模型通过学习生成低熵结果来实现一种基于最小化熵的损失函数优化。我们将这种损失函数记为Lsharp,其计算公式为:

其中N为总像素数。

如图3所示,展示了锐化效果。其中,P表示输入图像的预测结果,S-P则表示对P进行锐化处理后的输出结果。

D. Consistency Across Multi-Scale 跨多尺度一致性

在骨干网的解码器部分,通常采用卷积后接上采样操作。在训练过程中,我们可以利用解码器模块内部不同尺度的中间特征。通过应用2x、4x和8x上采样以及卷积操作来统一其尺寸。我们的目标是增强不同尺度输出的一致性。首先,我们根据多尺度特征P1、P2、P3、P4计算出一个平均特征P烙(如图1所示)。随后,我们使用Lconsis方法评估每个量表与平均特征P烙之间的一致性。评价公式如式(6)、(7)、(8)所示。

式中,C为分割任务的类数,n为多尺度输出的个数,n为总像素数。

E. Loss Function 损失函数

提出的PLGDF框架旨在通过最小化该复合目标函数,从标记和未标记数据中学习:

在式(5)和式(8)中,我们分别给出了Lsharp和Lconsis的表达式。在处理Lsup和Lsemi时,我们采用了结合交叉熵损失和骰子损失的方法[31],这种方法在医学图像分割领域非常常见。骰子损失的计算公式如下:

其中,PI代表模型预测的像素I值,而gi代表ground truth的像素I值。为优化模型训练效果,我们引入λ(t),一种基于广泛使用的时变高斯预热函数[43],用于调节有监督和无监督损失在不同训练阶段的比例。其具体公式定义如下:

其中w为最终调节权值,t为当前训练步长,tmax为最大训练步长。

Iv.实验和结果

A. Dataset 数据集

在本文中,我们评估了所提出的PLGDF方法,并将其与之前在三个公开数据集(胰腺ct数据集、LA数据集和BraTS2019数据集)上的六项工作进行了比较。所有的数据集都与3D分割任务相关联。
1)胰腺CT:胰腺CT数据集[44]包括82张3D腹部增强CT扫描,来自53名男性和27名女性受试者。CT扫描的分辨率为512×512像素和不同的像素大小。切片厚度为1.5 ~ 2.5 mm。
在本研究中,我们随机选择60张图像用于训练,20张图像用于测试,遵循类似研究中常用的标准数据分割协议[24]。为了确保体素值的一致性和可比性,我们应用了裁剪操作,将值限制在125至275 Hounsfield Units (HU)的范围内[45]。此外,我们进行了数据重采样,以实现1.0×1.0×1.0 mm的各向同性分辨率。
2) LA: LA数据集[46]是2018年心房分割挑战赛的基准数据集,包含100个用于训练的钆增强MR成像扫描,分辨率为0.625×0.625×0.625 mm。由于LA的测试集缺乏公开可用的注释,我们分配了80个样本进行训练,并保留了剩下的20个样本进行验证[24]。随后,我们在同一验证集上评估了我们的模型和其他方法的性能,以确保公平的比较。
3) BraTS2019:公开的BraTS2019数据集[47]包括335名被诊断为胶质瘤的患者的扫描结果。该数据集包括T1、T2、T1对比增强和FLAIR序列,以及由放射科专家注释的相应肿瘤分割。在这项研究中,我们专注于使用FLAIR模式对数据集进行分割。我们进行了随机分割,分配250次扫描用于训练,25次扫描用于验证,60次扫描用于测试[28]。

B. Implementation Details 实施细节

在训练阶段,我们从预处理后的数据中随机抽取3D patch。对于LA数据集,设置为112 × 112 × 80的补丁大小,而对胰腺CT和BraTS2019数据集,则采用96 × 96 × 96的补丁大小。针对这三个数据集,我们采用了批量大小为4的设置,每个批量包含两个标记和两个未标记的补丁。所采用的骨干网络是V-Net[31]。此外,我们对网络进行了调整,使其能够生成多尺度输出,并将评估多尺度一致性的尺度数设置为4。按照[24]和[28]所述的方法,我们对PLGDF模型进行了胰腺CT和LA数据集的15,000次迭代和BraTS2019数据集的30,000次迭代的训练。

在测试阶段,我们采用固定步幅的滑动窗口方法提取斑块。具体而言,在LA数据集上,滑动窗口大小为112 × 112 × 80,步幅为18 × 18 × 4。在胰腺CT和BraTS2019数据集上,滑动窗口大小为96 × 96 × 96,步长为16 × 16 × 16。随后,我们基于patch的预测重建整个体积的最终结果。

在训练过程中,我们采用了SGD优化器,动量为0.9,权重衰减设置为1e-4。学习率设为1e-2,超参数T设为1e-1。在本研究中,我们按照[21][48][49]所述的方法,在三个具有代表性的半监督数据集上分别使用10%和20%的数据对网络进行训练。我们的框架在PyTorch 1.12.0中实现,使用Nvidia RTX 3090显卡和24GB内存。

为了进行定量评估,我们采用了四个指标:Dice、Jaccard、平均表面距离(ASD)和95% Hausdorff距离(95HD)。在训练阶段,由于模型包含多尺度输出,我们在学生模型中采用了四尺度输出,而教师模型仅使用最高尺度输出。

同样,在网络的推理阶段,我们仅使用最高尺度的输出,如图1所示,表示为P1。因此,在此节点,我们的骨干网络等同于V-Net。在训练过程中,P2、P3和P4分别用于学生模型。

C. Analysis of State-of-the-Art Semi-supervised Techniques: 对现有半监督技术的分析:

我们系统性地对比分析了我们提出的框架与当前最领先的六种semi-supervised segmentation techniques,包括UAMT (UAMT[38])、形状感知对抗网络(SASSNet) (SASSNet[48])、双任务一致性框架(DTC) (DTC[49])、不确定性校正金字塔一致性(URPC) (URPC[28])、SS-Net (SS-Net[50])和相互一致性网络(MC-Net+) (MC-Net+[24])。值得注意的是,我们采用了UAMT、SASSNet、URPC、DTC、SS-Net和MC-Net+的官方代码、结果和数据预处理方案。其中,我们以MC-Net+的结果作为基准进行对比。

胰腺-CT数据集上的结果:表1展示了我们模型与六种半监督方法在胰腺-CT数据集上的定量对比,同时比较了使用5%、10%、20%和100%标记数据进行监督学习的V-Net模型。实验结果表明,我们提出的方法在Dice、Jaccard、95HD和ASD四项评估指标上显著优于当前最先进的方法(SOTA)。从表中可以看出,我们的方法表现尤为突出,尤其是在仅使用5%或10%标记数据时。使用5%标记数据时,我们获得了74.69%的Dice分数,8.19的95HD和1.74的ASD指标。这些数值不仅超过了六种方法的精度,且与基于等效数据注释的SOTA方法相当。在10%标记数据下,我们的方法在Dice、Jaccard、95HD和ASD四项指标上均优于仅使用20%标记数据注释训练的模型。

如图4所示,在5%和10%的标记数据下,采用其他方法对胰腺CT数据集进行二维和三维可视化。红实线代表真实边界,蓝虚线代表预测边界。

图4展示了基于5%和10%标记数据训练的胰腺CT数据集上图像分割的可视化结果。可视化结果采用2D和3D透视图展示。显然,仅使用5%标记数据时,其他对比模型无法准确分割胰腺,而我们模型的分割结果更接近真实值(GT)。同样地,在10%标记数据的情况下,我们的算法预测结果更为精确。在二维视觉表示中,对比方法的假阴性率较高,而我们的模型实现了更精确的识别。这进一步验证了我们提出模型的有效性。

  1. LA数据集上的实验结果:表2展示了LA数据集上的定量实验结果。与现有最优算法进行对比,我们的模型在5%、10%和20%标注数据条件下均取得了最佳的Dice分数。在20%标注数据的条件下,我们的模型达到了91.34%的Dice分数,接近甚至超越了100%标注数据监督学习获得的91.62% Dice分数。值得注意的是,在5%标注数据条件下,我们的Dice得分达到了88.72%,显著超过了其他对比算法的准确率,除了MC-Net,该算法仅使用了10%的标注数据进行训练。在10%标注数据条件下,我们的模型性能与基于20%标注数据的其他算法相当。同时,我们实现了最低的95HD和优异的ASD指标。图5展示了基于5%和10%标注数据训练的LA数据集图像分割的可视化结果。与现有算法相比,我们的模型在生成左心房时表现出更强的完整性与准确性。特别是在5%标注数据条件下,我们的模型成功地消除了大多数孤立区域并保留了更多的细节特征,而其他算法往往会产生较多的假阳性噪声预测。在2D视图中,我们的预测结果与真实解剖图(Ground Truth, GT)的吻合度更高。这些直观的可视化结果有力地证明了我们方法的有效性。

如图5所示,在5%标记数据和10%标记数据的LA数据集上,采用其他方法进行2D和3D可视化实验。其中,红线表示真实边界,绿线表示预测边界。

D. Results on the BraTS2019 dataset BraTS2019数据集的结果

在表3中,我们展示了BraTS2019数据集上的定量实验结果。与现有六个SOTA模型相比,我们的模型通过有效利用5%、10%和20%的未标记数据,获得了更高的Dice和95HD分数。具体而言,使用5%的标记数据,我们获得了84.96%的Dice分数,显著超越了Dice中得分最高的80.31%(仅使用10%标记数据的比较模型所能达到的指标)。图6展示了BraTS2019数据集上的三维体分段结果。在2D视图中,我们的模型表现得比现有模型更优,且在识别具有挑战性的病变方面更加可靠。这不仅验证了我们模型的优越性,还表明其能够有效识别具有挑战性的病变。

如图6所示。在5%和10%标记数据的条件下,基于BraTS2019数据集,采用其他方法进行二维和三维的可视化展示。其中,实线表示真实边界,虚线表示预测边界。

基于胰脏CT数据集的消融实验中,每个损失项都对应一个单独的模块,其中mix m表示混合模块。

V. ABLATION STUDY 消融研究

在本研究工作中,我们进行了对胰腺CT数据集的研究,以分析每个组成部分的贡献效应及其贡献。

A. Effect of the Combination of Module. 模块合并的效果。

在我们提出的框架中,除了用于计算标记数据丢失的Lsup损耗外,我们还整合了Mix模块,并与Lsemi、Lsharp和Lconsis三个损耗模块相结合。每个损耗代表了我们组合的不同模块。为了验证这些模块的有效性,我们进行了烧蚀实验,表4中的结果展示了不同策略的性能表现。仅使用Lsup(即利用少量标记数据进行全监督学习)时,模型的准确率相对较低。然而,在引入Lsemi后,模型的准确率显著提升。此外,当这些策略整合在一起时,结果持续优化。这表明我们采用的策略是有效的,有助于增强模型的鲁棒性。值得注意的是,即使不使用Lconsis,仅结合Lsup和Lsemi的策略,其性能也与表4中所展示的SOTA模型不相上下。由于我们的框架包含了URPC[28]中提出的Lconsis策略,表中的结果表明,即使不使用Lconsis,该框架依然表现出色。

B. Effect of the temperature T

为了提升分割边界精度,本研究引入了锐化函数以强化熵最小化约束。消融实验研究在胰腺CT数据集上进行,分别采用5%和10%的标记数据,以评估温度T对模型性能的影响。图7左侧展示了不同温度T下锐化函数的应用情况,右侧则显示了基于不同T值训练的PLGDF模型在胰腺-CT数据集上的Dice分数表现。结果显示,Dice值在各T值上呈现均匀性,凸显了模型对温度波动的鲁棒性。在训练过程中,观察到升高温度不足以严格执行熵最小化约束,而降低温度可能加剧伪标签噪声,最终导致分割精度下降。因此,采用校准温度为0.1的锐化函数在所有数据集上一致生成软伪标签。

C. Limitations and future work 局限性和未来工作

VI. DISCUSSION AND CONCLUSION 讨论与结论

本文提出了一种新型的半监督医学图像分割框架,命名为PLGDF。在均值-教师网络的基础上,我们采用教师模型的预测作为未标记数据的伪标签,以促进学生网络的训练。此外,我们采用未标记数据与标记数据的混合策略,以增强数据集的多样性。进一步地,我们对未标记数据的预测应用了锐化操作,以提升分割边界清晰度和准确性。通过确保骨干网络解码部分在不同尺度上保持一致性,我们进一步增强了模型的稳定性。

全部评论 (0)

还没有任何评论哟~