GNN in KG(三) Logic Attention Based Neighborhood Aggregation for Inductive Knowledge Graph Embedding

阅读量：

本文发表于AAAI2019会议，其作者分别来自Sun Yat-sen大学、腾讯AI实验室以及武穴大学。在系统学习了前两篇论文之后我们了解到GK嵌入模型主要由编码器与解码器两个部分构成。值得注意的是融合图神经网络的编码器在创新潜力上具有更大的发展空间这是因为其聚合机制直接影响着模型的整体性能表现。在此基础上本文提出了一种理想聚合器的概念并阐述了其实现所需的关键条件。

Permutation Invariant. 这也是图神经网络中的一个基本特性：聚合操作与节点邻域的排列顺序无关。
- Redundancy-Aware. 知识图谱中的事实通常是相互依赖的：一个体在芝加哥公牛队打球通常暗示他是篮球运动员。基于实体邻域中的这种冗余是有益的：从而使得聚合操作能够提取相关信息。一个好的聚合操作应该能够利用这种非显式的冗余信息。
- Query-Relation-Aware. 在常见的知识图补全任务中，默认给出的是查询关系：例如live_in关系。一个聚合操作可能会利用这些信息集中在附近的相关事实：例如"play for"芝加哥公牛队。这条性质与前一条有所不同：因为live_in关系并不一定真的与play_for有很强的因果或包含关系：二者之间仅存在一定的概率同时出现。结合后续算法讨论的内容：这条性质旨在强调聚合操作需要建模不同关系之间的概率分布。

为此，在研究领域中首次提出了一种创新性的聚合网络体系架构——Logic Attention Network（LAN）。该体系通过运用了两个不同的方法——逻辑规则机制与神经网络机制——分别从粗粒到精细粒地建模了关系级与邻居级信息。其中前者遵循了统计理论的基础原理；而后者则依赖于深度学习中的注意力机制来捕捉关键特征。

Preliminaries

Notations

知识图谱由三元组构成：

本文使用 $N_K(e)$ 表示实体 $e$ 相关的一条关系以及另一个实体：

每个节点e对应的两个变量分别是其相邻节点集合和相关边集合。基于给定的知识图谱K及其相关的属性信息集I, 目的是学习一个聚合函数A。

Framework

编码器。它首先通过权重矩阵 $W_e∈R^{n×d}$ 将输入节点进行嵌入表示，并输出 $e_i^I∈R^{n×d}$ 。对应的边对实体的影响则被建模为：

$w_r$ 表示关系 $r$ 的转换矩阵，并满足单位向量的要求。接着，聚合函数的输出为：

聚合函数 $A$ 被选中池化或RNN。

$|·|_{L1}$ 表示L1正则化的一种方法，在这种情况下我们旨在通过减少头实体与关系到尾实体之间的差异来实现这一目标

Logic Attention Network

注意

本文采用如下两种方式去估计注意力系数：

Logic Rule Mechanism 使得实体e与相邻关系 $r_1$ 之间存在关联并可能导致另一个相邻关系 $r_2$ 的存在。这些看似不相关的边之间可能具有潜在的依存关系。基于以下数学模型建立这种潜在依存性的量化表示：

其中 $1(x)$ 是一个指示函数，在 $x$ 取true值时赋值为1，在否则情况下赋值为0。为了衡量两种关系同时发生的情况数量与第一种关系单独发生频次之间的比率，并将其结果定义为两者之间的关联概率，在聚合器的部分中指出Query Relation Aware这一特性可能暗示着live_in对play_for存在影响的可能性，并从研究者角度来看 play_for已经成功地支撑了live_in的发展情况因此应弱化其他关联的影响程度所以Logic概率被定义为：

这里的max可以理解为影响力最大的边。

Neural Network Mechanism。这部分就是GAT中的注意力，没啥好说的。

将这两种权重机制结合在一起得到最终的注意力版本的聚合函数：

Training Objective

训练的时候需要引入负例：

单个实体的损失函数为：

$γ$ 是一个超参数， $[x]_+=max\{0,x\}$ 。那么总体的损失函数就是全部的实体的损失之和：

以下是对文本内容进行同义改写的版本

那么联合的损失函数为：

实验

数据集：

对于inductive的任务，需要有一部分在训练过程中不可知的数据。因此，从测试数据集中随机抽取 $R=(5\%,10\%,15\%,20\%,25\%)$ 。然后使用两种不同的策略构建不可知实体 $U'$ 。一个叫Subject，另一个是Object。前者把只在测试集中出现的subject添加进 $U'$ ，后者则添加object。如果在原始数据集中没有任何邻居，那么则在 $U'$ 中过滤掉这个实体。并且要确保不可见的实体不会出现在最终的训练集或验证集中。将原始训练集分为两个数据集，新的训练集和辅助集。如果 $s,o\inE$ 那么被添加到新的训练集中；如果 $s,o$ 有一个在 $U'$ 中，则被分配到辅助集中。表1是2x5=10种产生的数据集。

Experiments on Triplet Classification

LSTM在性能上与MEAN相比有所不如，但所需参数数量相对较少。这一发现凸显出为知识图谱（ $KGC$ ）设计邻域聚合器时考虑排列不变性的必要性。另一方面，在所有数据集上 LAN 模型均表现优异, 这一验证其在知识图谱补全（ $KBC$ ）任务中的有效性。

Experiments on Link Prediction

使用MMR以及Hits@k作为评价指标。

结果：只写了Subject-10数据集上的数据，因为别的也差不多。

然后是一些消融试验：

不同的score function：

图3中可以看出，当 $U'$ 值上升时会引起模型性能的下降；然而与其他指标相比，该指标（LAN）的下降速率较慢。

Table 6 中展开了案例分析研究，并观察到 LAN 将性别这种次要因素放置于最低层级位置，在实际应用中取得了更好的效果，相较于 MEAN 方法而言具有显著的优势。

全部评论 (0)

还没有任何评论哟~

GNN in KG(三) Logic Attention Based Neighborhood Aggregation for Inductive Knowledge Graph Embedding

本文发表在AAAI2019，作者来自SunYatsenUniversity，TencentAILab，WuhanUniversity。经过了前两篇论文的学习，现在我们知道了GKembedding分为...

GNN in KG(六) Few-Shot Knowledge Graph Completion

本文针对知识图谱补全的小样本学习问题，提出了fewshotrelationlearningmodelFSRL。目录 fewshort 数据增强或正则化 Metalearning（元学习）小样本其他...

GNN in KG(七) Topology-Aware Correlations Between Relations for Inductive Link Prediction in KG

目录 Methods Modelingcorrelationsbetweenrelations Modelinggraphstructures TheframeworkofTACT Experimen...

GNN in KG(四) Estimating Node Importance in Knowledge Graphs Using Graph Neural Networks，KDD2019

目录 Introduction PRELIMINARIES METHOD ScoreAggregation PredicateAwareAttentionMechanism CentralityAdj...

Zero-Shot Embedding for Unseen Entities in Knowledge Graph

摘要知识图嵌入的目的是学习实体和关系的潜在语义表示。然而，现有的大多数方法只能应用于KG补全，因此无法识别包括不可见实体或outKG实体在内的关系。本文在样本学习的基础上，提出了一种联合学习KG和实...

Knowledge Embedding Based Graph Convolutional Network

研究问题提出了一种可以充分结合异构的节点信息和边信息，同时学习这两者的嵌入的图卷积网络KEGCN，并将之前的几种知识图谱CNN纳入一个统一的框架下背景动机传统的图卷积模型一般不关注学习边的嵌入，...

KG-BERT: BERT for Knowledge Graph Completion

研究内容第一篇使用预训练语言模型做知识图谱补全的论文背景动机大多数知识图谱补全方法只使用到了结构信息，这会受到知识图谱的稀疏性的制约已有的引入语言模型的方法独立地表示实体和关系的描述，忽略了它...

【PaperReading】Knowledge Graph Embedding Based Question Answering

KnowledgeGraphEmbeddingBasedQuestionAnswering 摘要关键词引言问题陈述基于QAKG的知识嵌入知识图嵌入谓词和头部实体学习模型，基于神经网络的谓...

KG-BERT for Knowledge Graph Completion 笔记

Abstract 1、采用预训练的语言模型BERT来补全知识图谱 2、将知识图谱中的三元组视为文本序列，并提出新框架KGBERT 3、方法：用三元组的实体描述和关系描述作为输入，利用KGBERT语言模...

Learning Knowledge Graph Embedding WithHeterogeneous Relation Attention Networks

摘要知识图KG嵌入的目的是研究知识图的嵌入表示，以保持知识图的固有结构，图神经网络作为一种有效的图表示技术，在学习知识图嵌入方面表现优异。然而，知识分子具有内在的异质性，它包含了各种类型的实体和关系...

是否确定退出登录?

GNN in KG(三) Logic Attention Based Neighborhood Aggregation for Inductive Knowledge Graph Embedding

Preliminaries

Notations

Framework

Logic Attention Network

Training Objective

实验

Experiments on Triplet Classification

Experiments on Link Prediction

全部评论 (0)

相关文章推荐

GNN in KG(三) Logic Attention Based Neighborhood Aggregation for Inductive Knowledge Graph Embedding

GNN in KG(六) Few-Shot Knowledge Graph Completion

GNN in KG(七) Topology-Aware Correlations Between Relations for Inductive Link Prediction in KG

GNN in KG(四) Estimating Node Importance in Knowledge Graphs Using Graph Neural Networks，KDD2019

Zero-Shot Embedding for Unseen Entities in Knowledge Graph

Knowledge Embedding Based Graph Convolutional Network

KG-BERT: BERT for Knowledge Graph Completion

【PaperReading】Knowledge Graph Embedding Based Question Answering

KG-BERT for Knowledge Graph Completion 笔记

Learning Knowledge Graph Embedding WithHeterogeneous Relation Attention Networks