文本多标签分类-概述

阅读量：

一.多类VS多标签

多类分类(Multiclass classification)

表示分类任务中有多个类别,多类分类是假设每个样本都被设置了有且仅有一个标签。比如对一堆水果图片分类, 它们可能是橘子、苹果、梨等，一个水果可以是苹果或者梨, 但是同时不可能是两者。

多标签分类(Multilabel classification)

给每个样本一系列的目标标签. 可以想象成一个数据点的各属性不是相互排斥的,比如一个文档相关的话题. 一个文本可能被同时认为是宗教、政治、金融或者教育相关话题。就是同一个实例，可以有多个标签。

二.多标签分类的难点

类标数量不确定

有些样本可能只有一个类标，有些样本的类标可能高达几十甚至上百个。

类标之间相互依赖

例如包含蓝天类标的样本很大概率上包含白云，如何解决类标之间的依赖性问题也是一大难点。

多标签的训练集比较难以获取。

三.两种思路

1）转化问题

转化问题数据，使之适用现有算法 ，比如把问题转化为一个或多个单目标分类问题，或是回归问题。

2）算法适应

指针对某一特定的算法进行扩展，从而能够处理多标签数据，改进算法，适用数据 。

转换问题

1）集成式

将训练样本按每个标签构造一个训练集，每个样本属于或不属于这个标签，对每个标签单独训练一个分类器，然后将多个分类器的结果合成。

2）转换成多分类

将每个多标签单独看做一个新标签，在一个更多的标签集上做多分类。通过设定阀值来取多标签.(例如使用sigmoid,取所有大于0.5的标签作为多标签)

3）标签组合

将每个多标签组合单独看做一个新标签，在一个更多的标签集上做多分类。

适应算法

1）传统机器学习模型中的多标签分类模型有:

kNN多标签版本MLkNN，SVM的多标签版本Rank-SVM等。

2）在深度学习中常常是修改多分类模型的输出层，使其适用于多标签的分类。

全部评论 (0)

还没有任何评论哟~

文本多标签分类-概述

一.多类VS多标签多类分类Multiclassclassification 表示分类任务中有多个类别,多类分类是假设每个样本都被设置了有且仅有一个标签。比如对一堆水果图片分类,它们可能是橘子、苹果、...

多标签分类概述

前言本文介绍了多标签分类的基本概念和评估指标，总结了可用于提高多标签分类模型性能的多种方法：建模技巧、监督特征选择方法、无监督特征选择方法和上采样方法。本文来自公众号CV技术指南的技术总结系列关...

文本多标签分类-SGM

论文标题：SGM:SequencegenerationmodelforMultilabelclassification 论文地址：<https://arxiv.org/pdf/1806.04822.p...

【Bert】文本多标签分类

1\.算法介绍 1.1参考文献复旦大学邱锡鹏老师课题组的研究论文《HowtoFineTuneBERTforTextClassification?》。论文:https://arxiv.org/pdf...

多标签文本分类数据集_标签感知的文档表示用于多标签文本分类（EMNLP 2019）...

原文： LabelSpeciﬁcDocumentRepresentationforMultiLabelTextClassiﬁcation（EMNLP2019）多标签文本分类摘要：本文使用标签相关...

【层级多标签文本分类】科技资源文本层次多标签分类方法

科技资源文本层次多标签分类方法 1、背景 1、作者（第一作者和通讯作者）王岳，李昂，李雅文 2、单位北京邮电大学 3、年份 2022 4、来源计算机工程与应用 2、四个问题 1、要解决什么问题？...

bert文本分类——单标签与多标签对比

单标签： defcreatemodeloriginalbertconfig,istraining,inputids,inputmask,segmentids,labels,numlabels,useo...

python+tensorflow中文文本多标签分类

整体流程可以分为以下流程： 1：加载数据集 2：数据预处理 3：搭建神经网络模型 4：训练数据模型 1：加载数据集从数据库或excel、csv数据表中读取中文文本及其对应的标签数据 2：数据预处理 ...

【层级多标签文本分类】融合标签层级结构的文本分类

融合标签层级结构的文本分类 1、背景 1、作者（第一作者和通讯作者）刘翰错，黄贤英 2、单位重庆理工大学 3、年份 2021 4、来源山西大学学报（自然科学版） 2、四个问题 1、要解决什么问题...

多标签分类_多标签分类文献阅读（7）

学习带有部分标签的DeepConvNet进行多标签分类LearningaDeepConvNetforMultilabelClassificationwithPartialLabels 摘要 DeepC...

是否确定退出登录?

文本多标签分类-概述

一.多类VS多标签

二.多标签分类的难点

三.两种思路

全部评论 (0)

相关文章推荐

文本多标签分类-概述

多标签分类概述

文本多标签分类-SGM

【Bert】文本多标签分类

多标签文本分类数据集_标签感知的文档表示用于多标签文本分类（EMNLP 2019）...

【层级多标签文本分类】科技资源文本层次多标签分类方法

bert文本分类——单标签与多标签对比

python+tensorflow中文文本多标签分类

【层级多标签文本分类】融合标签层级结构的文本分类

多标签分类_多标签分类文献阅读（7）