Advertisement

pytorch--新闻标题数据集文本分类

阅读量:
  1. 数据预处理

词嵌入

先将字符处理为向量,我选择使用已经训练好的词嵌入。

为什么可以使用别人训练好的词嵌入?

例如:篮球在各种语境中通常指同一个概念。我们的新闻标题分类任务本质上属于较为常见的类型因此我们可以借鉴已有现成的词向量模型。然而存在某些词汇其意义会因语境的不同而有所变化需要采用更加专业的方法来构建词嵌入系统。

文本分类的十个类别分别是

  1. 构建模型

TestRNN

设置路径

将npz格式的embedding,用numpy读进来,然后转tensor格式

参数设置

lstm模型

全部评论 (0)

还没有任何评论哟~