论文浅尝 | Open world Knowledge Graph Completion
来源:AAAI2018
论文链接:https://arxiv.org/pdf/1711.03438.pdf
代码链接:https://github.com/bxshi/ConMask
本文旨在解决知识库补全问题,并与传统KGC任务的情境存在显著差异。传统知识库补全方法通常假设实体及其关系已经在KG中存在,并将其定义为闭合世界知识图谱生成任务(Closed-World KGC)。这一特性表明其显著依赖现有知识图谱中的联系特性,在处理弱连接关系方面表现不足,并且难以有效整合来自外部新实体的信息。针对上述局限性,本研究进一步提出开放世界知识图谱生成任务(Open-World KGC)。所提出的模型命名为ConMask,并主要包括三个关键组件:
(1)关系依赖内容遮蔽:该技术旨在突出保留与任务相关的关键词并去除无关词汇;模型采用了基于相似度计算的关注机制来获取与特定关系相关的上下文词及其对应的权重矩阵;经过观察分析发现目标实体通常位于具有较高权重的关键字周围,并提出了基于此考虑上下文权重求解的方法
(2)目标融合:从相关文本中提取目标实体的嵌入表示(采用全卷积神经网络技术)。其中:
一部分输入为mask处理后的内容矩阵。
每层先执行两个一维卷积操作,在经过sigmoid激活函数后进行批归一化处理。
随后经过最大池化操作得到最终输出。

为了避免过多的参数,在获取实体名称等文本特征的过程中,本文采用语义平均方法,用于生成特征的嵌入表示。
(3) Target entity resolution:基于候选目标实体与抽取实体在知识图谱中的嵌入表示间的相似度进行计算,并结合其他辅助特征信息生成排序结果列表。研究者提出了一种基于排序损失的列表级学习方法,在采样过程中采用50:50的比例策略分别替换头实体与尾实体作为负样本,并采用softmax作为激活函数来构建S函数。

论文的整体模型图为:

本文在DBPedia 50k和DBPedia 500k数据集上的表现相对较好,并且通过引入Closed-World KGC技术的相关实证研究进一步验证了该方法的有效性,在FB15k基准测试中表现优异,并且在原先的两个基准测试中也取得了令人满意的成效。
笔记整理:李娟,浙江大学博士在读,研究兴趣为知识图谱,表示学习。
中文开放知识图谱(简称OpenKG.CN)致力于推动中文知识图谱数据的开放共享与互联互通,并以此为基础推广知识图谱技术和语义计算的应用与发展。

转载须知提示: 转载内容时应当标明出处,并包含原始链接信息。若需要更改标题,请明确标注原始标题。
点击阅读原文 ,进入 OpenKG 博客。
