Advertisement

Learning Placeholders for Open-Set Recognition

阅读量:

43

43

概述:

传统的分类器通常被设计为在封闭环境中运行,并将训练数据与测试数据划分为同一类别集合。然而,在实际应用场景中可能会遇到不属于现有类别的新类别输入情况。此时将这些新类别会被错误地归类到已知类别中会导致潜在的问题出现。在这种情况下,则需要开发开放集识别技术以维持对已知类别的识别能力并拒绝未知类别实例的存在。封闭集模型在处理熟悉类别的实例时往往过于自信地进行预测判断因而当扩展至开放环境时则面临跨领域校准与阈值选择的关键挑战

为此而言,开发出了一种称为PROSER的学习开放集识别占位符系统;该系统通过赋予数据与分类器留出位置来预先准备识别未知类别。

  1. 学习数据占位符旨在用于预测开放性类别中的数据,并在此过程中将封闭域训练转换为开放域训练。
  2. 此外,在两类任务之间存在的不变特征信息基础上,在已知与未知两类任务间的特定分界点上引入分类器占位符。
  3. 该系统通过流形混合方法有效地生成新的类别,并动态调节保留开放集分类器的能力。
  4. 通过多组典型数据集上的实验验证了该方法的有效性。

促进开放集识别的目的可以概括为一个校准问题[8, 34]。

  1. 第一步是准备好用于未知类别的封闭集模型,在此过程中需要引入针对新类别的数据占位符,并将开放集转换为封闭集。
  2. 第二步则是更加有效地区分已知实例与未知实例,在此过程中应通过保留针对新类别的分类器占位符来校准模型对开放区域的过度自信预测。

主要贡献:

基于上述激励因素,在开发一种名为PlaceholdeRs for Open-SEt Recognition(PROSER)的方法中,在两个维度上校准了开放集分类器。具体而言,在封闭集分类器的基础上引入了一个额外的分类器占位符来增强其性能,并将此类别阈值作为已知与未知之间的特定类别进行区分。同时,在开放集分类器中保留占位符以获取目标与非目标类别间的不变特征信息。
为了有效预测新类别的分布情况,在设计中采用了生成数据占位符的方法,并以此模仿开放集类别的特性;这样不仅降低了复杂性成本还能实现将封闭式分类器转换为开放式分类器的目的;并且在测试阶段可以根据具体情况自适应地设定各个类别对应的阈值。
通过多种数据集的实验验证显示;所提出的PROSER方法不仅能够有效提升未知检测能力;而且在开放集识别问题上也展现出显著的优势。
研究结果进一步表明;通过决策边界可视化技术可以看出;PROSER系统能够根据不同类别组合自动学习并适应相应的自适应阈值设置。

模型结构:分类器+类占位符+数据占位符

为解决封闭式分类器校准难题而使用

  1. 学习数据占位符的目标是模仿新类的表现形式,并将封闭学习转化为开放学习。
  2. 为新的类别预留一个分类器占位符的目的在于通过这个占位符增强封闭集分类器的能力,并让其能够自适应地输出特定类别的决策阈值来区分已知类别与潜在的新类别。

类占位符:在分类器中加入K+1、K+2等类别标记以表示未知类别,并通过微调训练使新增的某一个未知类别分类器能够对已知样本输出次高的概率值

在每个训练批次中,在嵌入层前一层输出中使用加权平均的方法将小批次内两个不同类别的样本进行融合。其权重参数遵循Beta分布。特别地,这种融合方式属于流形上的数据混搭。值得注意的是,当权重参数过于极端时(如接近0或1),这种混搭可能会导致结果偏向某一类别。

训练过程:1.采用两个不同的损失函数来进行模型训练。第一个阶段的目标是通过引入一个用于识别待定类别的新分类器来优化整体性能;第二个阶段则是利用混合样本集上的交叉熵作为目标函数,并在此过程中优化模型使其倾向于将混合样本归为待识别类别。2.最后一步是对模型预测出来的各类别置信度进行调整,并确保基于已知类别测试集中至少95%的数据能够被正确分类。

测试过程:直接基于类占位符的分类器进行分类

数据集:

ID:1.CIFAR10 2.CIFAR+10 3.CIFAR+50 4.TinyImageNet 5.SVHN

OD: - CIFAR{1} {2} {3} {4}, - TinyImageNet, - SVHN; Omnist[\{14\}], MNIST-noise; Noise (SVHN; Omnist[\{14\}]; MNIST-noise; Noise)

测试指标:AUROC,macro-averaged F1-scores

实验内容

1.未知检测

2.开放集检测

3.Ablation

全部评论 (0)

还没有任何评论哟~