Advertisement

Improving Named Entity Recognition for Chinese Social Media with Word Segmentation Representation Le

阅读量:

简介

文章的主要贡献在于结合训练分词的模型(单向LSTM-CRF)与NER的训练过程,并以期进一步提升NER模型的效果。

模型结构

模型的总体结构如下:

模型结构图

左边为中文分词采用的模型架构(LSTM+CRF),右边则为实体识别(NER)任务所采用的模型架构,在该架构中发现,在NE R 模型中的 CRF 层的主要特征来源于该层三个关键维度的信息融合

  • 该字符的嵌入类型
    • 该字符的嵌入量即在分词过程中使用的该字符嵌入
    • 分词模型中每个字符在隐藏层中的输出结果(其中,在CRF层前一层的位置上的输出结果)

训练时的目标函数如下:

在这里插入图片描述

分词模型的损失函数由第一项构成,而NER的损失函数由第二项组成;其中\lambda代表权重参数,在实际应用中通常会对NER模块赋予更高的重视程度,因此一般设置\lambda<1以优化整体性能

全部评论 (0)

还没有任何评论哟~