句子分类_Bert做新闻标题文本分类

阅读量：

本文旨在介绍一种简便的方法来使用BERT-seq2seq框架来进行文本分类任务。

https://github.com/920232796/bert_seq2seqgithub.com

上面还有很多好玩的小例子，可以去自己尝试！

先来看下效果

这次是14分类

复制代码

    target = ["财经", "彩票", "房产", "股票", "家居", "教育", "科技", "社会", "时尚", "时政", "体育", "星座", "游戏", "娱乐"]

即输入一个句子，输出14类中概率最大的那一类～

输入：

两个句子，让模型去预测分别属于哪一类。

输出：

可以看到输出结果就是体育和房产！

其实完成文本分类任务所需的时间并不长，在一个完整的训练周期内就显示出良好的效果。经过一个完整的训练周期大约用了两小时左右的时间就能达到预期目标。

流程

具体流程也很简单

准备数据时首先要对输入和输出的数据进行处理。输入是一系列独立的文本句子；输出则是每个句子对应的类别，并将这些类别编码为数字ID的形式。具体来说，在分类任务中使用时，则需要将每一类（文本）转化为唯一的一个编号（如14个类别，则对应的目标ID为0至13）。
在下载好预训练模型与词典之后, 我们就可以方便地完成模型的加载过程了。

复制代码

 self.bert_model = load_bert(word2idx, model_name=model_name, model_class="cls", target_size=len(target))

    
 load_model_params(self.bert_model, model_path)

这是来自文本分类示例中的代码片段，在第一行即可加载BERT模型；其中model.class=cls参数设置表明我们正在进行文本分类任务；而target.size则表示各类别数量的总和。

在代码块的第二行，我们使用预训练好的参数来进行模型微调。完成这一操作后，模型就能够顺利地应用于我们的任务了。

具体详细代码可以去github上面找下这个文本分类的例子，非常简单！

另外欢迎来自己的博客逛逛～blog另外欢迎来自己的博客逛逛～

blogwww.blog.zhxing.online

全部评论 (0)

还没有任何评论哟~

句子分类_Bert做新闻标题文本分类

本文介绍一下如何使用bertseq2seq框架很轻松的做文本分类任务～框架地址在： https://github.com/920232796/bertseq2seqgithub.com 上面还有很多...

中文新闻标题分类

importos importsys importpickle importlogging logging.basicConfig format='%asctimes%levelnames%messa...

vocab 文本_bert文本分类

本文只讲述bert文本分类应用，不涉及理论部分。亲测应用很简便，在预训练模型基础上，个人电脑完全可以小规模训练属于自己的模型，而且准确率很高。这里给出英文文本分类应用流程，需要自己准备数据。

pytorch--新闻标题数据集文本分类

1.数据预处理词嵌入先将字符处理为向量，我选择使用已经训练好的词嵌入。为什么可以使用别人训练好的词嵌入？比如：篮球，在不同语境下都是一样的意思，我们新闻标题分类任务，算是比较大众的任务，所以我...

Paddle2.0实现中文新闻文本标题分类

Paddle2.0实现中文新闻文本标题分类中文新闻文本标题分类Paddle2.0版本基线（非官方）调优小建议数据集地址任务描述数据说明提交答案代码思路说明数据集解压数据处理数据读取...

【NLP】新闻文本分类-----Bert文本分类

【NLP】新闻文本分类Bert文本分类 Bert算法介绍基于Bert的文本分类 BertPretrain BertFinetune Bert算法介绍 Google在NAACL2018发表的论文中提出...

【NLP】新闻文本分类

【NLP】新闻文本分类赛题理解和思路分析数据读取思路一：特征提取+分类器 TFIDF算法介绍 TFIDF实践步骤赛题理解和思路分析 ccccc 数据读取赛题以匿名处理后的新闻数据为赛题数据，...

新闻文本分类-Task4

Task04：基于fasttext的文本分类 fasttext原理说明要说fasttext的原理，就不得不谈到word2vec。其实二者本身有着天然的联系。

中文新闻分类数据集_NLP-新闻文本分类实战

一、赛题理解赛题名称：零基础入门NLP之新闻文本分类赛题目标：通过这道赛题可以引导大家走入自然语言处理的世界，带大家接触NLP的预处理、模型构建和模型训练等知识点。赛题任务：赛题以自然语言处理为背景...

roberta融合模型创新中文新闻文本标题分类

项目源码获取方式见文章末尾！600多个深度学习项目资料，快来加入社群一起学习吧。《往期经典推荐》项目名称 1.【基于CNNRNN的影像报告生成】 2.【卫星图像道路检测DeepLabV3Plus模...

是否确定退出登录?

句子分类_Bert做新闻标题文本分类

先来看下效果

流程

全部评论 (0)

相关文章推荐

句子分类_Bert做新闻标题文本分类

中文新闻标题分类

vocab 文本_bert文本分类

pytorch--新闻标题数据集文本分类

Paddle2.0实现中文新闻文本标题分类

【NLP】新闻文本分类-----Bert文本分类

【NLP】新闻文本分类

新闻文本分类-Task4

中文新闻分类 数据集_NLP-新闻文本分类实战

roberta融合模型创新中文新闻文本标题分类

中文新闻分类数据集_NLP-新闻文本分类实战