Improving Named Entity Recognition for Chinese Social Media with Word Segmentation Representation Le
发布时间
阅读量:
阅读量
简介
文章的主要贡献在于结合训练分词的模型(单向LSTM-CRF)与NER的训练过程,并以期进一步提升NER模型的效果。
模型结构
模型的总体结构如下:

左边为中文分词采用的模型架构(LSTM+CRF),右边则为实体识别(NER)任务所采用的模型架构,在该架构中发现,在NE R 模型中的 CRF 层的主要特征来源于该层三个关键维度的信息融合
- 该字符的嵌入类型
- 该字符的嵌入量即在分词过程中使用的该字符嵌入
- 分词模型中每个字符在隐藏层中的输出结果(其中,在CRF层前一层的位置上的输出结果)
训练时的目标函数如下:

分词模型的损失函数由第一项构成,而NER的损失函数由第二项组成;其中\lambda代表权重参数,在实际应用中通常会对NER模块赋予更高的重视程度,因此一般设置\lambda<1以优化整体性能
全部评论 (0)
还没有任何评论哟~
