bert 是单标签还是多标签的分类_BERT多标签分类

阅读量：

在过去的一年中，深度神经网络引领了自然语言处理领域的新纪元。基于预训练模型的研究已经推动了许多NLP任务取得了显著的进步。一些重要里程碑包括ELMo、ULMFiT和OpenAI Transformer。这些方法使得我们能够在大量数据集（如维基百科全文）上进行无监督语言模型的预训练，并在下游任务中微调这些预训练好的模型。今年这一领域最具吸引力的是BERT的发布——一种基于多语言Transformer架构的设计。该模型在多种NLP任务中表现卓越，并且还预训练了两个无监督的任务：掩模语言建模和下一个句子预测。这使得我们可以利用经过微调后的BERT模型来解决特定的任务。

该系统将借助Kaggle提供的垃圾评论分类挑战进行评估BERT在多标签文本分类任务中的性能。

我们从哪里开始？

Google Research近期推出了BERT基于张量计算引擎的技术实现，并提供了一系列预训练好的模型集合。

BERT-Base, Uncased: 12层, 768个隐层, 12-heads, 110M 个参数

BERT-Large, Uncased: 24层, 1024个隐层, 16-heads, 340M 个参数

BERT-Base, Cased: 12层, 768个隐层, 12-heads , 110M 个参数

BERT-Large, Cased: 24层, 1024个隐层, 16-heads, 340M 个参数

BERT基础版本（最新版建议使用）涵盖 $...$ 原样保留

Chinese BERT-Base is designed for both Simplified and Traditional Chinese versions. The model consists of twelve layers with a total of seven hundred sixty-eight potential units per layer. It employs twelve attention heads to process information effectively. The model contains a total of one hundred ten million parameters.

采用较小规模的BERT基础模型作为无框架架构完成任务。该模型包含12个层结构，并将所有输入文本转化为小写字母进行处理。

我们采用HuggingFace公司推出的高质量PyTorch实现BERT模型，并可通过以下链接获取完整代码：https://github.com/huggingface/pytorch-pretrained-BERT。我们已成功利用该预训练脚本库将该模型的TensorFlow预训练权重转换为PyTorch模型参数。

我们的实现主要源自BERT原始实现中所包含的 $run\_classify$ 示例。

数据准备

我们在类InputExample 准备数据：

text_a: 评论内容

text_b：未用到

labels：训练数据对应为标签，测试数据为空

分词

BERT-Base是一个无监督学习模型，并基于大约3万个不同的词汇构建而成。在分词过程中，系统会将输入文本划分为词汇表中可用的标记序列。为了应对词汇表中未包含的新单词挑战,BERT引入了一种称为"基于Byte Pair Encoding(BPE)的WordPiece标记化技术"来解决这一问题。该方法通过将未知词汇分解为更小的部分子词,并将每个未知词替换为其对应的子词序列来进行表示.值得注意的是,这些子词本身就是词汇表中的成员,因此我们已经学习了其上下文信息.这样一来,未知词本身的上下文就被限制为子词上下文组合的形式.有关此方法的具体实现及其优势,请参考使用子字词单位处理稀有单词的神经机器翻译模型的相关研究

训练

我们设计了一个与原始BERT架构相同的训练循环结构，并按照以下参数进行预训练：批次大小为 $32$ 、序列长度设定为 $512$ 以及学习率维持在 $3 \times 10^{-5}$ 水平。

我们有可能利用多块GPU进行训练。该Pytorch模型被封装到DataParallel模块中进行并行计算。这样一来，在现有的多块GPU配置下就能实现高效的并行训练过程。

受限于特定的技术限制, 我们未能采用半精度浮点运算技术. 二进制交叉熵损失函数不具备支持半精度浮点运算的能力. 该特性不会对最终结果产生显著影响, 其训练时长可能有所延长.

评估指标

我们调整了精度度量函数以包括阈值，默认设置为0.5。

对于多标签分类问题而言，在性能评价方面更为关键的是基于受试者工作特征曲线（Receiver Operating Characteristic Area Under the Curve, ROC-AUC）这一指标。这也是Kaggle比赛中常用的评估标准之一。我们通过逐一计算各个标签对应的ROC-AUC值来量化模型表现，并对单个标签进行评估时采用微观平均方法以获得更精确的结果

我们进行了一些实验，只有一些变化，但更多的实验得到了类似的结果。

实验结果

训练损失：0.022，验证损失：0.018，验证准确度：99.31％

各个标签的ROC-AUC分数：

toxic: 0.9988

severe-toxic: 0.9935

obscene: 0.9988

threat: 0.9989

insult: 0.9975

identity_hate: 0.9988

Micro ROC-AUC: 0.9987

全部评论 (0)

还没有任何评论哟~

bert 是单标签还是多标签的分类_BERT多标签分类

过去的一年里，深度神经网络开创了自然语言处理的激动人心的时代。使用预训练模型的领域的研究已经导致许多NLP任务的最新结果的巨大飞跃，例如文本分类，自然语言推理和问答。一些关键的里程碑是ELMo，ULM...

bert 是单标签还是多标签的分类_【多标签分类】基于类别属性的注意力机制解决标签不均衡和标签相似问题...

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要12分钟跟随小博主，每天进步一丢丢作者：太子長琴NLP算法工程师来自：AINLP公众号 Paper: http://nlp.csai.ts...

bert 是单标签还是多标签的分类_基于深层神经网络的多标签分类问题的高层特征和标签提取...

1摘要在深层神经网络中，池层有助于减少冗余和参数数量，而不需要执行额外的学习过程。虽然这些运算符能够处理单标签和多标签问题，但它们的具体目标是减少特征空间，因此对于多标签数据，这也应该在标签空间中完...

bert文本分类——单标签与多标签对比

单标签： defcreatemodeloriginalbertconfig,istraining,inputids,inputmask,segmentids,labels,numlabels,useo...

多标签分类评价指标_多标签分类指标

多标签分类评价指标 MetricsplayquiteanimportantroleinthefieldofMachineLearningorDeepLearning.Westarttheproblem...

多标签分类_大规模多标签分类

介绍自然语言处理中有一项任务叫做大规模多标签分类（ExtremeMultiLabelClassification，XML）。给定一段文本，和大量的标签（千、万、十万、百万数量级），目标是输出这段文...

【Bert】文本多标签分类

1\.算法介绍 1.1参考文献复旦大学邱锡鹏老师课题组的研究论文《HowtoFineTuneBERTforTextClassification?》。论文:https://arxiv.org/pdf...

BERT多标签分类（BERT Multi Label Classifier）

本文在MultiLabelClassifierfinetune这个项目上进行改写 <https://github.com/Vincent131499/MultiLabelClassifierfinet...

多标签分类_分类问题多标签（multilabel）、多类别（multiclass）

大致上，解决multilabel的方法有两种大致上，解决multilabel的方法有两种 1转化问题。把问题转化为一个或多个单目标分类问题，或是回归问题。 2算法适应。修改学习算法使得能直接处理mu...

One-Error多标签分类_多分类及多标签分类算法

一、单标签多分类 1、单标签二分类算法原理 1、单标签二分类这种问题是我们最常见的算法问题，主要是指label标签的取值只有两种，并且算法中只有一个需要预测的label标签；直白来讲就是每个实例的可...

是否确定退出登录?

bert 是单标签还是多标签 的分类_BERT多标签分类

全部评论 (0)

相关文章推荐

bert 是单标签还是多标签 的分类_BERT多标签分类

bert 是单标签还是多标签 的分类_【多标签分类】基于类别属性的注意力机制解决标签不均衡和标签相似问题...

bert 是单标签还是多标签 的分类_基于深层神经网络的多标签分类问题的高层特征和标签提取...

bert文本分类——单标签与多标签对比

多标签分类 评价指标_多标签分类指标

多标签分类_大规模多标签分类

【Bert】文本多标签分类

BERT多标签分类 （BERT Multi Label Classifier）

多标签分类_分类问题多标签（multilabel）、多类别（multiclass）

One-Error多标签分类_多分类及多标签分类算法

bert 是单标签还是多标签的分类_BERT多标签分类

bert 是单标签还是多标签的分类_BERT多标签分类

bert 是单标签还是多标签的分类_【多标签分类】基于类别属性的注意力机制解决标签不均衡和标签相似问题...

bert 是单标签还是多标签的分类_基于深层神经网络的多标签分类问题的高层特征和标签提取...

多标签分类评价指标_多标签分类指标

BERT多标签分类（BERT Multi Label Classifier）