Advertisement

Aspect-based Sentiment Analysis with Type-aware Graph Convolutional Networks and Layer Ensemble 阅读笔记

阅读量:

1.Introducton

本文选自第2021年 held于NAACL会议的一篇论文。在该论文中,作者阐述了基于复杂层次结构设计的类型感知图卷积神经网络模型(T-GCN)。该模型通过多层次架构实现对不同类型节点特征的有效捕捉。

2.Model

2.1 Type-aware Graph Construction

本部分内容主要阐述了如何构建类型感知图的相关知识。我们认识到,在以往的研究文献中,研究者们主要聚焦于词语之间的依存关系,并未能充分重视词语间的关系类型。如果仅仅重视依存关系而忽视其他关联方式,则可能导致模型在识别词语之间关联重要性方面出现偏差。本文详细介绍了该类图谱构建的具体步骤和方法

首先:通过一些现有的工具包,从而获得依赖结果

eft

其次:作者使用了

athbf{A}=efta_{i, j}ight_{n imes n}

作为领接矩阵来存放

x_{i}

x_{j}

的依赖关系,如果

x_{i}

x_{j}

之间有依赖关系那么

a_{i, j}

的值为1,否则为0。用

athbf{R}=eftr_{i, j}ight_{n imes n}

来存放

x_{i}

x_{j}

的依赖关系类型,每一种依赖关系都对应了不同的值。

最后:为了利用关系类型,作者利用了一个转变矩阵将

r_{i, j}

映射为

athbf{e}_{i, j}^{r}

具体构造过程以及模型大概如下图所示。

2.2 T-GCN

在模型的主要组件中,作者构建了一个由L层构成的T-GCN网络结构,并且在每一层中的图边设计上进行了专门化处理。

首先,我们知道,对于

x_{i}

x_{j}

在每一条边上,我们已经获取了各节点间关系类型的数值编码。并在此处将该关系类型数值与节点的潜在状态进行关联。实现了。

athbf{s}{i}{(l)}=\mathbf{h}_{i}{} plus athbf{e}{i, j}^{r}

athbf{s}{j}{(l)}=\mathbf{h}_{j}{} plus athbf{e}{i, j}^{r}

随后,作者将计算的值带入到了权重计算公式

p_{i, j}^{}=rac{a_{i, j} dot xp eft} dot athbf{s}{j}{(l)}\right)}{\sum_{j=1}{n} a{i, j} dot xp eft} dot athbf{s}_{j}^{}ight}

,得到了权重

p_{i, j}^{}

。之后通过一个可训练的矩阵

athbf{W}_{R}^{}

,将

athbf{e}_{i, j}^{r}

“融入”隐藏状态中

athbf{h}{j}{(l-1){rime}}=athbf{h}{j}{(l-1)}+\mathbf{W}_{R}{} dot athbf{e}_{i, j}^{r}

最后,作者将计算的权重还有隐藏状态的值带入到了图卷积公式中。

athbf{h}{i}^{}=igmaeft} dot athbf{h}{j}{(l-1){rime}}+athbf{b}^{}ightight

得到了下一层i的隐藏状态的值。

ps:这里的

x_{i}

指的是当前需要计算隐藏状态的词的下标,

x_{j}

值得是这个句子中词的下标。

具体的模型运作过程如下图所示。

2.3 Attentive Layer Ensemble

我们提出了一种基于注意力机制的多层集成系统学习方法,以便于实现T-GCN层的能力。

首先,作者将每一层的输出的隐藏状态的向量进行一个平均

athbf{o}^{}=rac{1}{|athcal{A}|} dot um_{x_{k} n athcal{A}} athbf{h}_{k}^{}

,得到

athbf{O}^{}

。随后通过一个加权平均得到最后的结果

athbf{o}=um_{l=1}^{L} elta^{} dot athbf{o}^{}

2.4 Encoding and Decoding with T-GCN

对于编码,作者是介绍了两种不同的编码的方式。

1.是将句子

athcal{X}

作为输入放到编码器中

athbf{H}^{athcal{X}}=B E R T

,最后得到初始的隐藏向量。

2.是将句子-方面对作为输入放到编码器中eft=B E R T,得到初始的隐藏向量。

对于解码,作者先将T-GCN的输出放入一个全连接层

athbf{u}=athbf{W} dot athbf{o}+athbf{b}

,最后再对得到的结果做一个softmax得到最后的情感结果。

3.Experiments

实验结果:

模型比较:

消融实验:

4.Conclusion

本文中 作者提出了一种基于图卷积网络(T-GCN)的设计方案用于亚语义分析(ABSA)。其中 输入图构建于 输入句子 的语法依存关系模型之上 具体而言 对于 每个词 言 本文 采用注意力机制对 T-GCN 中相关边进行加权融合 同时 还设计了多层注意力机制以整合不同层次的信息从而提升模型的整体表现。通过广泛的实验研究 我们发现该方法在标准测试集上均展现出超越现有算法的优势

全部评论 (0)

还没有任何评论哟~