中文命名实体识别NER：FLAT

阅读量：

一、模型结构

1、位置编码

2、基于相对位置编码的self-attention

3、Feed Forward Neural Network

二、损失函数

来自ACL2020复旦大学邱锡鹏老师团队的NER领域又一力作：FLAT: Chinese NER Using Flat-Lattice Transformer.

本文在Lattice LSTM(ACL 2018)的基础上作出了两方面的改进：

作者提出了一种将Lattice图结构无损转换为扁平的Flat结构的方法，并将LSTM替换为了更先进的Transformer Encoder，该方法不仅弥补了Lattice LSTM无法**「并行计算」(batchsize=1)的缺陷，而且更好地建模了序列的「长期依赖关系」** ；

作者提出了一种针对Flat结构的**「相对位置编码机制」** ，使得字符与词汇得到了更充分更直接的信息交互，在基于词典的中文NER模型中取得了SOTA。

一、模型结构

1、位置编码

FLAT给每一个token/span(字、词)增加了两个位置编码，分别表示该span在sentence中开始(head)和结束(tail)的位置，对于字来说，head position和tail position是相同的。这样扁平的结构允许我们使用Transformer Encoder，其中的self-attention机制允许任何字符和词汇进行直接的交互。

span是字符和词汇的总称，span之间存在三种关系：交叉、包含、分离，然而作者没有直接编码这些位置关系，而是将其表示为一个稠密向量。作者用head[i]和tail[i]表示span的头尾位置坐标，并从四个不同的角度来计算xi和xj的距离:

这会得到四个相对距离矩阵：，其中表示x[i]的开始位置和x[j]的开始位置的距离。然后将这四个距离拼接后作一个非线性变换，得到x[i]和x[j]的位置编码向量R[i,j]：

其中P[d]是Transformer采用的绝对位置编码：

2、基于相对位置编码的self-attention

attention：

论文中作者采用了Transformer-XL (ACL 2019)中提出的基于相对位置编码的self-attention：

可以直观地将前两项分别看作是两个span之间的内容交互和位置交互，后两项为全局内容和位置bias，在Transformer-XL中 R是根据绝对位置编码直接计算得出的，而这里的 R经过了非线性变换的处理。最后，用A*替换attention中的A，取出字的编码表示，将其送入CRF层进行解码得到预测的标签序列。(Transformer模型: <>)

3、Feed Forward Neural Network

这个全连接有两层，第一层的激活函数是ReLU，第二层是一个线性激活函数，可以表示为：

二、损失函数

损失函数和LSTM-CRF模型相同（<>），由两部分组成，P是Transformer得到的标签预测得分，是一个n*k维的矩阵，其中n指字符个数，k指标签个数，A是CRF得到的标签转移得分：

所有可能的标签路径中正确路径标签分数值最高：

参考文献：

FLAT: Chinese NER Using Flat-Lattice Transformer

https://mp.weixin.qq.com/s?__biz=MzIxMzkwNjM2NQ%3D%3D&chksm=97ad16a3a0da9fb5a6224f42cb91b7e7fdfef48f4f4f8a6bca7098242c3da4527db00327c7bc&idx=1&mid=2247495793&scene=21&sn=9adbf02fa611c6cdbf3dd4f4cb8592dd#wechat_redirect

全部评论 (0)

还没有任何评论哟~

中文命名实体识别NER：FLAT

目录一、模型结构 1、位置编码 2、基于相对位置编码的selfattention 3、FeedForwardNeuralNetwork 二、损失函数来自ACL2020复旦大学邱锡鹏老师团队的NER...

python中文命名实体识别-中文命名实体识别NER

NER（中文实体命名识别）光健字:中文命名实体识别NERBILSTMCRFIDCNNBERT 摘要：对中文命名实体识别一直处于知道却未曾真正实践过的状态，此次主要是想了解和实践一些主流的中文命名实体...

命名实体识别_中文医学命名实体识别

IncorporatingdictionariesintodeepneuralnetworksfortheChineseclinicalnamedentityrecognition 总述作者提出了融...

中文命名实体识别

中文命名实体识别 1\.语言技术平台（LTP） 2\.Pyhanlp 3\.BosonNLP 1\.语言技术平台（LTP） LTP官方地址：语言技术平台（LanguageTechnologyPlant...

crf++中文命名实体识别

（在新浪搜索部实习，方向为基于crf的中文命名实体识别，现将自己一个月的学习总结如下，本人也是初学者，文中所讲仅为个人理解，错误之处欢迎各位指正）第一部分：基础知识 1.1命名实体识别概念命名实体...

中文命名实体识别NER

命名实体识别（英语：NamedEntityRecognition），简称NER，是指识别文本中具有特定意义的实体，主要包括人名、地名、机构名、专有名词等，以及时间、数量、货币、比例数值等文字。

自然语言处理之命名实体识别：BERT：10.命名实体识别实战：中文命名实体识别

自然语言处理之命名实体识别：BERT：10.命名实体识别实战：中文命名实体识别环境搭建与数据准备 1.1安装必要的Python库在开始中文命名实体识别NER的实战之前，我们需要确保我们的开发环境已...

BilSTM 实体识别_NLP实战-中文命名实体识别

前言：本文章将通过pytorch作为主要工具实现不同的模型（包括HMM，CRF，BiLSTM，BiLSTM+CRF）来解决中文命名实体识别问题，文章不会涉及过多的数学推导，但会从直观上简单解释模型的...

中文命名实体识别综述

摘要中文命名实体识别（NER）任务是信息抽取领域内的一个子任务,其任务目标是给定一段非结构文本后,从句子中寻找、识别和分类相关实体,例如人名、地名和机构名称。中文命名实体识别是一个自然语言处理（NL...

NLP之中文命名实体识别

在MUC6中首次使用了命名实体（namedentity）这一术语，由于当时关注的焦点是信息抽取（informationextraction）问题，即从报章等非结构化文本中抽取关于公司活动和国防相关活动...

是否确定退出登录?

中文命名实体识别NER：FLAT

一、模型结构

1、位置编码

2、基于相对位置编码的self-attention

3、Feed Forward Neural Network

二、损失函数

全部评论 (0)

相关文章推荐

中文命名实体识别NER：FLAT

python中文命名实体识别-中文命名实体识别NER

命名实体识别_中文医学命名实体识别

中文命名实体识别

crf++中文命名实体识别

中文命名实体识别NER

自然语言处理之命名实体识别：BERT：10.命名实体识别实战：中文命名实体识别

BilSTM 实体识别_NLP实战-中文命名实体识别

中文命名实体识别综述

NLP之中文命名实体识别