Relation Classification via Recurrent Neural Network论文阅读笔记

阅读量：

背景：

从Zeng等提出CNN深度学习模型解决关系分类问题开始（Relation Classification via Convolutional Deep Neural Network），陆续提出了很多模型，如MW-CNN（2015），CR-CNN（2015），DepLCNN（2015）等。虽然也有一些基于其他架构的模型，如MV-RNN（2012，它是一个递归网络，并不是时序模型），FCM（2014)，SDP-LSTM(2015），总体来说，CNN模型占据主导地位。

本文的主要贡献：
1.提出了基于RNN的框架，来对长距离关系模式建模。

2.证实了在SemEval-2010task8以及KBP37（新数据集）上，该模型由于基于CNN的模型。

3.使用了Position Indicator（PI），比Zeng（2014）提出的Position Feature（PF）更具通用性。

4.实证分析了基于RNN的方法在远程模式建模方面的能力。

由于自然语言的时序性，关系学习本质上是一个时序学习任务，应当使用时序模型。

CNN模型只能学习局部模式，不适合长距离建模。简单地增大CNN卷积窗口的大小是行不通的。MW-CNN（Multiple Window-CNN）中提出的方法虽然有效，但涉及更多的计算，且调整窗口大小并不容易。

Model：

1.Word Embedding

使用word2vec预训练的embedding。

2.Bi-directional network

基本的双向RNN模型

3.Max-pooling（新颖）

在实践中，由于循环连接的积累，会导致很快遗忘长期信息，且由于梯度消失问题，导致模型很难进行反向传播。

由此提出了使用CNN中的Max Pooling，从隐状态的每个维度中选出最大值，拼接成句子级特征向量，其维度与隐状态维度一致。

4.Model training

softmax回归，交叉熵损失，随机梯度下降。

5.Position Indicators

Zeng（2014）中提出的PF，为词向量额外增加了位置向量。

而由于在RNN中，由于模型学习整个单词序列，每个单词的相对位置信息可以在前向或后向递归传播中自动获取。因此，在单词序列中注释目标名词就足够了，而不需要更改输入向量。

如： “ people have been moving back into downtown ”.

对SemEval-2010task8数据集，由于没有官方划分的开发集，故采用8折交叉验证来调整超参数。

对KBP37数据集，划分10%作为开发集，调整超参数。

实验结果：
****

RNN模型优于CNN（2014）和MV-RNN（2012）。

RNN模型比使用语法解析作为额外资源的MV-RNN模型表现得更好。这表明RNN可以有效地从原始文本中学习关系模式，而无需任何明确的语言知识。

讨论：

1.长文本的影响

根据context的长度将测试集划分为5个部分，以验证RNN处理长序列的能力。

结果表明，context长度较大时，RNN模型性能明显优于CNN。

同时，PF可能更适合CNN，而PI可能更适合RNN。

2.长文本的比例

SemEval-2010task8数据集具有一定的局限性，它含有长句子的比例太少，不能充分展现不同模型的优势。

3.语义积累（新颖）

作者做了一个有趣的实验，以分析一个句子的语义是如何在模型中形成的。

结果表明：RNN一个词一个词地积累句子的语义，而CNN必须学习两个局部模式并将它们合并。显然，RNN模型更加合理。同时，RNN形成的语义分布比CNN更加平滑。

全部评论 (0)

还没有任何评论哟~

Relation Classification via Recurrent Neural Network论文阅读笔记

背景：从Zeng等提出CNN深度学习模型解决关系分类问题开始（RelationClassificationviaConvolutionalDeepNeuralNetwork），陆续提出了很多模型，如...

【论文研读】Relation Classification via Convolutional Deep Neural Network

核心：用卷积神经网络提取词语和语句级别的特征，将所有的单词标注作为输入（无预处理操作）。通过wordembedding将单词标记转换为向量，根据给定的名词提取词汇级别的特征，同时使用卷积神经网络学习语...

A Dependency-Based Neural Network for Relation Classification（DepNN，2015）论文阅读笔记

一、背景 SVM（2010） MVRNN（2012） CNN（2014） FCM（2014） DTRNN（2014） DTRNN使用RNN建模依赖树后，通过线性组合的方式将节点的词嵌入与其子节点的词嵌...

《Convolutional Neural Network for Sentence Classification》论文阅读笔记

文章前瞻： 1.本论文作者YoonKim发表于2014年的EMNLP，TextCNN用来处理句子级分类任务。 2.本文的超参数设置：dropout=0.5，filtersize=3,4,5，featu...

论文笔记--Recurrent Neural Network for Text Classification with Multi-Task Learning

论文笔记RecurrentNeuralNetworkforTextClassificationwithMultiTaskLearning 1\.文章简介 2\.文章导读 2.1概括 2.2文章重点技术...

论文笔记：Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Network

提出使用多实例结合分段CNN进行关系抽取主要内容：针对远程监督中利用启发式对其导致的错误标签以及特征提取过程中产生的噪音等两个问题，本文提出了一种基于多实例学习的分段CNN模型。

Recurrent Convolutional Neural Networks for Text Classification阅读笔记

下面是我对这篇文章内容的整理，因为刚刚接触这一方向，读的这方面的文章还比较少，知识的了解也不够，如果有不对的地方还请大家批评指正，谢谢！ RecurrentConvolutionalNeuralNet...

【论文笔记】Recurrent Neural Network Regularization

本文模型：https://github.com/tensorflow/tensorflow/blob/master/tensorflow/models/rnn/ptb 这篇文章引用量也是超高，总体来说...

【论文阅读】GCNN Traffic Classification with Graph Neural Network

GCNNTrafficClassificationwithGraphNeuralNetwork 摘要介绍流量分类模型 chainedgraph 摘要目前许多最先进的流分类器都是基于卷积网络等深度...

【论文阅读笔记】Recurrent fusion network for image captioning.

Recurrentfusionnetworkforimagecaptioning. ECCV2018. W.Jiang,L.Ma,Y.G.Jiang,W.Liu,andT.Zhang. 问题现有的基...

是否确定退出登录?

Relation Classification via Recurrent Neural Network论文阅读笔记

全部评论 (0)

相关文章推荐

Relation Classification via Recurrent Neural Network论文阅读笔记

【论文研读】Relation Classification via Convolutional Deep Neural Network

A Dependency-Based Neural Network for Relation Classification（DepNN，2015）论文阅读笔记

《Convolutional Neural Network for Sentence Classification》论文阅读笔记

论文笔记--Recurrent Neural Network for Text Classification with Multi-Task Learning

论文笔记：Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Network

Recurrent Convolutional Neural Networks for Text Classification阅读笔记

【论文笔记】Recurrent Neural Network Regularization

【论文阅读】GCNN Traffic Classification with Graph Neural Network

【论文阅读笔记】Recurrent fusion network for image captioning.