Advertisement

NNKGC: Improving Knowledge Graph Completion withNode Neighborhoods

阅读量:

摘要

知识图谱补全(KGC)的主要目标是识别查询实体之间的缺失关系。现有的基于文本的信息提取模型通过分析实体名称及其描述来推断给定头部实体与其关联的尾部实体的关系。然而,在现有研究中通常会关注头部实体在知识图谱中的邻域结构。尽管这些方法能够有效捕捉局部信息并聚焦于1跳邻居节点之间的联系;但其对复杂关系建模的能力仍有待提升。为了填补这一研究空白;本研究提出了一种基于节点增强型的知识图谱补全框架;通过图神经网络模型构建多跳距关系下的头部节点邻域表示;同时提升头部节点所包含的信息量;并引入了一个额外的任务以进一步优化模型性能;最终实验结果表明;该框架在两个公共数据集上均表现出显著优势;实例研究表明该模型能够有效预测可解释性的链接关系

1.介绍

基于实体-属性-关系(E-A-R)框架的知识表征(Knowledge Representation),其作为一种强大的数据组织形式,在人工智能领域已受到广泛关注,并被广泛应用于问答系统构建、个性化推荐算法设计以及语义检索系统开发等多个场景中。(Ehrlinger and Wöß, 2016)

知识图谱(KGC)主要采用两种主要方法:一是基于向量空间模型的知识图谱(KGC),二是基于文本表示的知识图谱。前者通过将关系视为图结构,并学习低维向量来表示实体及其关联;该模型通过优化特定损失函数实现对称性约束。后者则依赖于深度学习技术,在语义层次上提取高阶特征;其优势在于能够有效处理复杂语义关系并提取潜在语义信息。然而这些方法在归纳推理任务中表现欠佳;相比之下另一种更具代表性的知识图谱构建范式是基于文本的理解与推理框架:通过学习实体及其描述信息间的关联性推导出潜在的关系;其中最具有影响力的工作包括Yao等提出的双层感知机架构、Kim等人设计的注意力机制网络以及Safavi与Koutra提出的自监督学习框架;此外Wang等人开发的KEPLER系统进一步结合了预训练语言模型生成的上下文表征与知识图谱中的显隐式信息;而最近提出的SimKGC模型则引入了一种新型对比学习框架及负样本筛选策略,在性能上显著超越了传统向量空间方法

现有的大多数工作通常集中于将头部实体h与查询关系r共同建模,并着重关注元组(h, r, ?)预测正确尾部实体t的问题。(h;R)这一视角则倾向于仅关注头部实体名称或描述以及查询关系名称。此外,在现有方法中还考虑了头部实体及其邻域信息(Zhuo等,2022;Borrello等, 2021)。然而这些方法往往采用平面结构来建模邻域信息从而便于应用基于注意力机制的方法;或者出于计算效率的考量它们限制在单跳邻居范围内。在此研究工作中我们建议从多跳距离内扩展邻居范围以便提高头部实体信息的丰富性进而进一步优化知识图谱构建任务(KGC)。通过这种方法我们可以使头部实体能够包含更多显式信息这些信息可能有助于提升关系预测性能特别是当头部实体名称/描述较短且缺乏详细信息时效果尤为明显。为了进一步增强各邻居与尾部实体的相关性我们在KGC任务中引入了额外链接预测损失项并证明这一改进策略能够有效提升知识图谱构建性能。

全部评论 (0)

还没有任何评论哟~