Metadata-Induced Contrastive Learning for Zero-Shot Multi-Label Text Classification, WWW2022

阅读量：

本研究聚焦于无标签场景下的基于元数据的多标签文本分类问题。该方法完全不依赖任何经过标注的实例，并仅利用其表面名称及其描述信息。我们开发了一种新的元数据诱导对比学习方法MICoL（M...），用于计算文档与对应的多标签之间的相似度分数。

PRELIMINARIES

Metadata, Meta-Path, and Meta-Graph

元数据被称为网络中的额外信息，在本文所采用的学术网络中，通常会包含作者、机构以及主题等内容。该类学术网络被视作一个典型的异构图（HIN），其中不同类型的节点和边之间的构建模式可以通过meta-path或meta-graph来进行描述：

Meta-Path 。因网络中的不同实体间存在异构关系，则两个文档可以通过不同的路径建立联系。如两篇论文拥有共同的作者，则可通过构建基于论文作者节点的关系来实现连接；若有一篇论文引用另一篇，则可通过构建基于引用关系节点的关系来实现连接。本文将给出具体的元路径定义如下：

比如图3(a) 3(b)中的两条元路径就可以通过 $PAP$ 以及 $P\toP\leftarrowP$ 表示。
Meta-Graph 。在某些情况下，路径可能不足以捕获两个节点之间的潜在语义。例如，一个元路径不能描述至少共享两位作者的两篇论文之间的关系。请注意，这种关系值得研究，因为当我们推断论文之间的语义相似时，两个共同作者可以比一个作者提供更多的信息一名研究人员在其职业生涯中可能会从事多个主题，而两名研究人员之间的合作往往侧重于一个特定的方向。Meta-graph定义如下：

Connectivity

THE MICOL FRAMEWORK

MICoL采用了一个包含两个步骤的排序机制来进行文本重排任务。具体而言，在离散检索模块中主要完成生成用于对比学习的正样本配对和负样本配对的任务；而在连续重排序模块中则致力于学习一种自动化化的样本配对匹配模型以实现精确重排。在研究贡献方面，该方法通过巧妙地结合文档级别的元数据特征并提出了一种基于此的信息驱动型对比学习方案，在提升基于BERT模型的重排效果方面取得了显著提升的效果

Retrieval Stage

检索用于寻找知识库中的相似文档。本文采用了两种方式：exact name matching and sparse retrieval。
第一种直接进行label名称的匹配，如果标签 $l$ 出现在文档 $d$ 的文本中，那么则认为该文档包含标签 $l$ 。表示通过精确名称匹配获得的文档候选标签的集合用 $C_{exact}(d)$ 表示。
但是由于并非所有的标签都会出现在文档原文中，所以sparse retrieval采用了BM25进行文档匹配，获取高于某一阈值的文档-标签对作为正例。首先，标签会有一段文本描述，以及一个标签名，将这两个拼接起来： $t_l=n_l||s_l$ 。接下来，BM25的计算方式如下：

参数

Re-ranking Stage

重排阶段通过预训练语言模型对原始文本及其对应的标签信息进行编码，并借助对比学习机制区分正例与负例。其中主要采用两种不同的编码策略，具体实现细节见下文。

Bi-Encoder 。分别对二者进行编码，并计算二者CLS表示的余弦相似度：

Cross-Encoder 。将其整合进一个BERT模型中，并用学习得到的CLS向量 $e_{d||t_l}$ 作为计算相似度的基础向量；随后通过应用线性变换来预测相似程度：

每个文档都会相应地生成包含正反两类样本的数据集，并将其表示为 $(d,d^+), (d,d^-)$ 的形式。其中 $d^+$ 基于元知识体系进行定义，在能够从 $d$ 中到达的情况下被标记为正样本。针对Bi-Encoder模型而言，其损失函数计算公式如下：

对于Cross-Encoder，则为：

Training and Inference Procedures

训练和推断的过程不尽相同，总体可以用两个不同的算法进行描述：

在推断过程中必须对候选集合实施相似匹配行为；考虑到标签空间过于庞大从而必须缩减与之相关的配对范围：

EXPERIMENTS

接下来详细描述了对tail-label的预测效果，并基于对tail-label重新分类的标准来制定评估标准：

不同元路径以及元图下的性能比较（真是吓人的实验量）：

全部评论 (0)

还没有任何评论哟~

Metadata-Induced Contrastive Learning for Zero-Shot Multi-Label Text Classification, WWW2022

本文研究零样本情境下基于元数据的多标签文本分类，它不需要任何带标签的标注文档，只依赖于标签表面名称和描述。为了训练一个分类器来计算文档和标签之间的相似度分数，提出了一种新的元数据诱导对比学习MICoL...

Contrastive Learning-Enhanced Nearest Neighbor Mechanism for Multi-Label Text Classification

摘要 1. 在MLTC任务中在这篇文章以前大多使用的方法是关注到文本的表示，相关的特征提取任务的优化，或者是针对于标签上的注意机制；要么就是注意到相关标签的关联性；但是这些内容都没有注意到实例的相似性...

Contrastive Learning for DeepFake Classification and Localization via Multi-Label Ranking

一、研究背景 1.二分类深度伪造检测已经趋于性能饱和，操纵部位定位及排序成为新的需求，而后者可被看作多标签排序问题。 2.以往二分类方法难以直接泛化到多标签排序问题上。二、技术路线利用多实例学习和...

Contrastive Embedding for Generalized Zero-Shot Learning

ContrastiveEmbeddingforGeneralizedZeroShotLearning 1Introduction GZSL在分类训练中存在原始特征空间远离语义信息从而导致缺乏辨别能力。

Meta-LMTC--- Meta-Learning for Large-Scale Multi-Label Text Classification

1\.简介： 1.这篇文章是2021年发在EMNLP上的文章，通过摘要部分来看这篇文章主要解决的问题就是长尾问题，即有大量的标签没有训练实例manylabelshavefeworevennoannot...

Learning Disentangled Label Representations for Multi-label Classification

LearningDisentangledLabelRepresentationsforMultilabelClassification，2022 学习多标签分类的解纠缠标签表示要点： 1、主流多标签...

Multi-Label Zero-Shot Learning with Structured Knowledge Graphs

未完。。。本文提出了一种用于多标签零样本学习（MLZSL）的深度学习架构，它能够为每个输入实例预测未知的类标签。受人类利用对象之间语义知识方式的启发，我们提出了一个框架，包含用于描述多个标签之间关系...

Deep Learning for Extreme Multi-label Text Classification阅读笔记

文章目录概述模型 Dynamicmaxpooling 损失函数 HiddenBottlenecklayer 实验参数设置实验结果概述 Extrememultilabel就是说总的标签量非常多...

Label prompt for multi-label text classification笔记

这篇文章是使用Prompt在多标签文本分类上的一篇发在SpringerNature上的文章，模型名称LPMTC 1.在摘要部分，文章主要是提到对于文本进行多标签分类是十分具有应用价值的一个任务，同时一...

Adversarial Multi-task Learning for Text Classification

论文:AdversarialMultitaskLearningforTextClassification 最近决定每周读一篇GAN的论文。一方面，提升自己的阅读理解能力。另一方面，拓展自己的思路。作为...

是否确定退出登录?

Metadata-Induced Contrastive Learning for Zero-Shot Multi-Label Text Classification, WWW2022

PRELIMINARIES

Metadata, Meta-Path, and Meta-Graph

THE MICOL FRAMEWORK

Retrieval Stage

Re-ranking Stage

Training and Inference Procedures

EXPERIMENTS

全部评论 (0)

相关文章推荐

Metadata-Induced Contrastive Learning for Zero-Shot Multi-Label Text Classification, WWW2022

Contrastive Learning-Enhanced Nearest Neighbor Mechanism for Multi-Label Text Classification

Contrastive Learning for DeepFake Classification and Localization via Multi-Label Ranking

Contrastive Embedding for Generalized Zero-Shot Learning

Meta-LMTC--- Meta-Learning for Large-Scale Multi-Label Text Classification

Learning Disentangled Label Representations for Multi-label Classification

Multi-Label Zero-Shot Learning with Structured Knowledge Graphs

Deep Learning for Extreme Multi-label Text Classification阅读笔记

Label prompt for multi-label text classification笔记

Adversarial Multi-task Learning for Text Classification