Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embeddings笔记,知识库嵌入
文章目录
-
论文标题:基于知识库嵌入的知识图谱多跳问答提升研究
-
摘要:
- 本文提出了一种基于复杂嵌入的知识图谱链接预测模型。
- 该模型通过引入双层自注意力机制来增强跨模态表示能力。
- 实验结果表明该方法在复杂场景下表现优于现有算法。
-
1 引言
-
2 相关工作 KGQA
-
3 背景
-
3.1 知识图谱:其表示能力与关联性分析
- 3.2 链接预测:其挑战与解决方案概述
- 3.3 知识图谱嵌入:其关键技术与发展现状
- 3.3.1 复杂嵌入:其表示能力与优化策略分析
-
4 嵌入式知识图谱问答:提出的方法
-
-
4.1 问题陈述
-
- 4.1.1 EmbedKGQA概述
-
4.2 知识图谱嵌入模块
-
4.3 问题嵌入模块
-
4.4 回答选择模块
-
- 4.4.1 关系匹配
-
-
-
5 实验方案
-
-
5.1 数据来源
-
5.2 基准模型
-
Knowledge Graph Question Answering (KGQA) Results
-
- 5.3.1 高阶问答研究
- 5.3.2 对WebQuestionsSP的回答机制探讨
-
5.4 针对缺失链接的知识图谱进行问答
-
5.5 答案选择模块的影响
-
-
6 结论
-

论文标题:使用知识库嵌入改进知识图的多跳问答
论文链接:https://aclanthology.org/2020.acl-main.412/
摘要
知识图谱(KG)是由实体作为节点、实体之间的关系作为类型边缘组成的多关系图。在知识图谱上进行问答任务(KGQA)的目标是回答以自然语言提出的查询。多跳 KGQA 需要对知识图谱中的多个边缘进行推理,以便找到正确的答案。知识图谱(KG)通常不完整,有许多缺失的链接,这为KG问答(KGQA)带来了额外的挑战,特别是对于多跳KGQA。最近关于多跳KGQA的研究已经尝试使用相关的外部文本来处理KG的稀疏性,但这并不总是那么容易获得。在另一条研究路线上,已经提出了KG嵌入方法来通过执行缺失链接预测来减少KG的稀疏性。这类KG嵌入方法虽然高度相关,但尚未被用于多跳KGQA。本文填补了这一空白,并提出了EmbedKGQA。EmbedKGQA在稀疏KG上进行多跳KGQA特别有效。EmbedKGQA还放宽了从预指定邻域中选择答案的要求,这是先前多跳KGQA方法强制执行的一个次优约束。通过在多个基准数据集上进行大量实验,我们证明了EmbedKGQA相对于其他最先进的基线方法的有效性。
1 介绍
知识图谱(Knowledge Graph, KG)由数百个实体及其关联关系构成(如美国加州等地点及其相互关联信息)。其中包含一些大型实例如维基数据、DBPedia、Yago及NELL等数据库。基于知识图谱的问题回答系统(Knowledge Graph Question Answering, KGQA)近年来发展成为机器学习领域的重要研究方向之一(Zhang等人, 2018年;Sun等人, 2019a)。在KGQA系统中给定一个问题陈述以及相关知识库,在分析问题与知识库中的关联信息后可获得准确的回答。
在多跳KGQA系统中
为了阐述这些观点,请参考图1中的示例。在此案例中,Louis Mellis作为主要输入端点承担着自然语言处理的任务,而我们希望模型选择的结果应为'犯罪'。若知识图谱包含从Gangster No. 1通向'犯罪'的关系,这样就能更加便捷地得出结论。然而,鉴于这一关键关系目前并未被记录,该模型需通过复杂推断绕过这一缺失环节,并在图表中标注了这条辅助推理路径。此外, KGQA采用了最多三步邻居搜索策略,这种限制导致真实答案'犯罪'无法直接被发现。

图1:在稀疏和不完整的知识图谱(KG)中进行多跳问答(KGQA)的挑战:在不完整的KG中,缺少边genre(Gangster No. 1, Crime)使得回答输入的自然语言问题变得更加困难,因为KGQA模型可能需要在KG上推理一条更长的路径(用粗线标记的边)。现有基于多跳知识图谱的问题回答方法也施加了启发式邻域限制(图中阴影区域),这通常使得真实答案(例如本例中的犯罪)无法触及。我们提出的EmbedKGQA方法通过在多跳问题回答过程中利用输入知识图谱的嵌入来克服这些限制。有关更多详细信息,请参阅图2和第4节。
已有研究沿另一条路径探索利用知识图谱嵌入预测知识图谱中缺失的链接以降低其稀疏性(Bordes等, 2013;Trouillon等, 2016;Yang等, 2014a;Nickel等, 2011)。这些方法通过学习实体与关系的高维嵌入并应用于链接预测。然而尽管这些KG嵌入方法具有较高的相关性它们尚未被用于多跳式KG问答——本文中我们填补了这一空白。特别地我们引入了一种名为EmbedKGQA的新系统该系统利用知识图谱嵌入执行多跳式知识图谱问答。本文的主要贡献包括:
本研究开发了一种创新性方法应用于多跳知识图谱问答(KGQA)任务——嵌入式 KGQA(Embed KG QA)。值得注意的是,在处理稀疏知识图谱的多跳 KG QA 时, 该方法表现得非常有效. 与以往针对此项任务的方法相比, 嵌入式 KG QA (Embed KG QA )扩展了选择答案的范围. 经过系统性的实验分析, 在多个真实世界数据集上测试后发现, 嵌入式-KG QA 验证了其相对于现有最佳基准方法的有效性.
我们已经提供了EmbedKGQA的源代码,以鼓励可重复性。
2 相关工作 KGQA
在以往的工作中(李等, 2018)基于TransE的方法(Bordes等人, 2013)被用于回答事实性问题;然而这种方法仅适用于单步推理问题,并不适用于多步推理场景;与此同时(Yih等人, 2015)以及(Bao等人, 2016)提出了基于特定子图提取策略以解决复杂问答问题的方法;其中一种方法(Bordes等人, 2014a)将头部实体对应的子图投影到高维空间中用于问题回答;此外记忆网络也被用来学习知识图谱中的事实嵌入以实现问答任务(Bordes等人, 2015);类似地(Bordes等人, 2014b)这类方法通过学习问题与三元组之间的相似函数并在测试阶段对候选答案进行评分;随后(Yang等人, 2014b)与(Yang等人, 2015)提出了一种基于嵌入空间的自然语言问题映射到逻辑形式的方法;近年来研究者们提出了多种神经网络模型用于问答任务相关工作:例如戴等(2016)、董等(2015)、郝等(2017)、卢科夫尼科夫等(2017)以及尹等(2016)均开发了神经网络模型用于候选答案排序任务;此外一些研究工作将每个关系视为独立标签并将其问答建模为分类问题:将上述单步推理技术扩展至多步推理场景是一项具有挑战性的研究课题
近来有研究表明,在构建知识体系时
知识图谱补全方法 :近年来成为热门研究领域的知识图谱嵌入技术在链接预测方面展现出显著的应用价值。传统的做法是将知识图谱中的三元组(头实体、关系、尾实体)通过定义一个得分函数来评估其有效性,并以此作为约束条件以确保正确三元组的得分高于错误三元组的得分。
RESNET团队于2016年提出的ResNet网络架构通过引入残差块实现了深度神经网络的训练与应用
TransE(Bordes等人, 2013)通过将实体嵌入到高维实数空间来实现知识图谱的表示,并以头部实体至尾部实体的平移操作来体现各关系特征;此外,在研究领域中提出了RotatE(Sun等人, 2019b)这一方法论框架,在复数空间维度下对实体进行映射,并采用复平面内的旋转操作来模拟复杂的关系模式
ConvE(Dettmers等人提出的一种方法)基于卷积神经网络进行学习头实体、尾实体以及关系间的评分函数。InteractE(Vashishth等人提出的一种改进模型)在此基础上引入了特征交互机制以提升性能。
3 背景
本节中, 我们对知识图谱(Knowledge Graph, KG)进行了正式定义. 此后, 并详细阐述了基于不完全知识图谱的链接预测问题. 随后介绍了用于知识图谱表示的嵌入方法, 并对ComplEx模型进行了深入分析.
3.1 知识图谱
基于给定的一组实体E与关联规则R,在本研究中我们定义知识图谱G为一系列三元组K的集合;其中每个三元组K均取自笛卡尔积空间E × R × E中的子集。每个特定的三元组可被标记为(h, r, t),其中h与t都属于集合E(分别代表主题实体与目标实体),而r则属于R(描述两者的关联规则)。
3.2 链接预测
在链接预测任务中,在基于 incomplete knowledge graph 的情况下进行推理以识别潜在的有效关系。 KG嵌入模型通过 scoring function φ 进行评估以确定每个 triple (h,r,t) 的对应分数 s = φ(h,r,t) ∈ ℝ 用于判断 triple 的完整性 旨在准确评估所有潜在缺失的关系
3.3 知识图谱嵌入
对于每一个e∈E和r∈R的知识图嵌入(KGE)模型都会产出两个向量{\mathbf{e}_{e}} \in {{\mathbb{R}}^{d_e}} 和{\mathbf{e}_{r}} \in {{\mathbb{R}}^{d_r}}其中ee与er分别对应de维与dr维向量每一种嵌入方法均配备有一个评分函数φ:E×R×E→R用于对可能存在的三元组(h,r,t)分配分数φ(h,r,t),其中h与t属于E而r属于R模型将给予评分结果使得对真实存在的三元组而言φ(h,r,t)>0而在于不真实的三元组则φ(h', r', t')<0
3.3.1复杂嵌入
复杂嵌入(ComplEx, Trouillon等人, 2016年)是一种基于张量分解的方法,在复数空间中对关系与实体进行嵌入表示。其中h和t属于集合E, r为实数集R中的元素, ComplEx通过生成{\mathbf{e}_{h},\mathbf{e}_{r},\mathbf{e}_{t}} \in {{\mathbb{C}}^{d}}这三个向量,并定义了一个评估函数来计算其性能指标

定义一个函数φ(h, r, t),使其针对所有的正确三元组其对应的得分值大于零;而对于错误的三元组,则其对应的得分值小于零。其中Re代表复数的真实部分。
4 嵌入式知识图谱问答:提出的方法
在此部分中,我们首先明确地定义了知识图谱问答(KGQA)的问题核心,并随后详细阐述了我们的模型框架.
4.1 问题陈述
我们定义E和R分别作为知识图谱G中的所有实体集合和关系集合。K表示在笛卡尔积空间E×R×E中可用的知识图谱事实所构成的子集。针对KGQA问题,在给定一个自然语言问题q以及该问题中出现的主题实体eh∈E的情况下,我们的目标是从E中提取一个实体et以便正确回答问题q。
4.1.1 EmbedKGQA概述
在这一配置下进行数据处理时,我们发现数据集中缺乏对细节的标注信息,例如问题类型或精确的操作步骤等具体指导。例如,在共同演员关系中涉及starred actor-1与starred actor之间的关联组合,但我们的模型并不依赖于这些标注信息。
嵌入式知识图谱问答(EmbedKGQA)采用知识图谱嵌入来回答多跳自然语言问题。
第一步,在嵌入空间中学习知识图谱的知识表示。
针对一个给定的问题随后学习该问题的预设知识表示。
最终通过综合分析这些预设的知识表示以确定最合适的答案。
在接下来的部分,我们将介绍EmbedKGQA模型。它由3个模块组成:
- KG嵌入模块负责为知识图谱中的每个实体生成相应的向量表示。
- 该问题嵌入模块通过计算得到问题对应的向量表示。
- 在候选实体中进一步筛选出最优选项后确定最终答案。
4.2 知识图谱嵌入模块
对属于集合E中的所有头实体h、尾实体t以及关系r进行ComplEx嵌入训练。这些嵌入被用于构建基于三元组的知识图谱中头实体、问题以及答案 entity之间的评分函数模型。数学公式显示为{\mathbf{e}_{h}, \mathbf{e}_{r}, \mathbf{e}_{t} } \in { {\mathbb {C} }^{{d}}}. 根据这些知识图谱在问答(QA) 训练集中的覆盖情况, 学习到的 these entity embeddings可以在后续步骤中选择冻结或者进一步微调以适应新的任务需求.
4.3 问题嵌入模块
该模块通过一种固定维度向量模型将自然语言问题q进行编码为\mathbf{e}_{q} \in \mathbb{C}^{d}的形式。其机制基于反馈循环神经网络架构。具体而言,在训练阶段系统首先采用预训练语言模型RoBERTa(Liu等人, 2019)对问题q进行编码生成768维表示。随后经过4层带有ReLU激活函数的全连接层处理后最终映射至复数空间域得到目标维度\mathbb{C}^{d}中的向量表示。
基于问题q、主题实体h属于集合E以及一组答案实体A属于E的子集的问题求解过程中, 该系统通过...来学习问题嵌入的方式是以便实现问题嵌入的学习目标。

在当前步骤中使用ComplEx评估机制(1)来计算φ值,在此过程中,ea和e_{\overline{a}}是在前一步骤中被学习得到的实体嵌入。
在每一个问题中,在计算分数φ(.)的时候需要考虑所有候选答案实体a’属于集合E。该模型采用最小化sigmoid输出与目标标签之间的二元交叉熵损失的方法来进行训练,在这种情况下,默认正确答案的目标标签被标记为1。当实际场景中遇到大量候选实体时,则实施适当的损失函数平滑处理策略。
4.4 回答选择模块
在推理阶段中,系统会对(头实体与问题)配对以及候选答案集合E中的所有候选答案a'∈E进行评估。对于规模较小的问答库如MetaQA,在实际应用中我们只需取分值最高的实体作为最终结果即可。

但是,在知识图谱规模较大时,则通过修剪候选实体有助于显著提升EmbedKGQA的效能。修剪策略将在下文详细阐述。
4.4.1 关系匹配
基于PullNet(Sun等人,2019a)的方法中,我们构建了一个评分函数S(r, q),该函数用于对每个问题q中的关系r ∈ R进行排序。具体而言,在处理这些问题时,我们使用了RoBERTa模型作为编码器,并将问题q表示为(< s >, w1, …, w|q|, < /s >)这样的单词序列输入模型。为了计算评分函数值,在RoBERTa模型的最后一层隐藏层输出向量hq与关系r的嵌入向量hr之间计算点积,并通过sigmoid函数将其映射到0到1之间的概率值。

在整个关系网络中, 我们筛选出得分高于0.5的关键关系, 并将这些关键关系标记为集合Ra的形式表达出来。针对到目前为止收集的所有候选实体a'(具体参考第4.4节的内容), 我们确定头实体h与之之间存在的最短路径上的各关键联系, 并将这些关键联系标记为Ra'的形式记录下来。接下来, 每个候选答案之间的关键联系得分为两者共有关键数量所决定的数值指标。

我们使用关系得分和ComplEx得分的线性组合来找到答案实体。

其中γ是一个可调的超参数。
5 实验细节
在本节中, 我们首先详细阐述了在该基础上评估我们方法的数据集, 然后对实验配置及结果进行了说明
5.1 数据集
- MetaQA(Zhang 等,2018)数据集是一个大规模的多跳知识图谱问答数据集,包含超过40万个与电影领域相关的问题。它包括1跳、2跳和3跳问题。在我们的实验中,我们使用了问题的“普通版”。除了问答数据外,MetaQA还提供了一个包含135,000个三元组、43,000个实体和九种关系的知识图谱。
- WebQuestionsSP(tau Yih等人,2016)是一个较小的问题回答数据集,包含4,737个问题。该数据集中的问题是1跳和2跳的问题,可以通过Free-base知识图谱来回答。为了方便实验,我们把知识库限定为Freebase的一个子集,该子集包含了所有与WebQuestionsSP问题中提到的实体在两步距离内的事实。此外,我们还进一步筛选知识库,仅包含数据集中出现的关系。这样得到的小型知识库包含180万个实体和570万个三元组。
5.2 基线
我们进行了基于键值记忆的网络、融合网络以及PullNet(Sun等,2019a)在WebQuestionsSP数据集上的实验对比分析,并对MetaQA数据集进行了单独的研究以评估VRNet(Zhang等, 2018)。这些方法成功实现了多轮知识图谱问答系统,在该系统中除了VRNet之外的所有方法都依赖于额外的文本语料库来缓解知识图谱稀疏性的问题。
- VRN (张等، 2018)基于变分学习算法,在知识图谱领域实现了多跳问答系统。
- 关键值存储网络(KVMem) (米勒等، 2016)是最初尝试以文本填充不完整知识库进行问答的第一个模型。该系统通过整合数据库中的事实信息与文本数据,并通过预设的记忆表进行检索。
- GraftNet (孙等人, 2018年)采用启发式策略构建了与问题相关的子图结构, 该子图包含了知识库的事实节点、实体标识符以及来自文本语料库的关键句子节点, 并利用一种变体的图卷积神经网络(Kipf和Welling, 2016年)进行了推理。
- PullNet (孙等人, 2019a)也构建了一个与查询相关的子图结构, 但其采用了不同的方法: 它通过从数据中"拉取"关键的事实节点和相关句子节点来生成更紧密关联的子图结构, 并且采用了基于图卷积神经网络的方法来进行推理。

表2展示了在MetaQA数据集上的结果。所有基线结果均源自Sun等人(2019a)。我们考察了两种设置:一种是基于完全知识图谱的MetaQA KG-Full,另一种是基于50%知识图谱的MetaQA KG-50。本表中的数值代表的是在第1位的检索命中率。其中括号内的数值对应于通过文献补充来增强不完整知识图谱设置的情况(即 MetaQA KG-50)。有关更多详细信息,请参阅第 5.3.1 节。
完整的知识图谱配置是问答系统中最为基础的一种设置方式。基于这样的数据集构建原则,在这种情况下答案总能存在于知识图谱之中,并且所有路径都不会出现断链的情况。然而,在实际情况中这种完全完整的知识图谱难以实现。因此,在训练QA模型时我们采用了一种更为实际的方法:通过随机删除知识图谱中约50%的三元组来模拟真实场景下的数据缺失问题。具体而言,在我们的实验环境中我们将这种配置方案命名为KG-50配置方案,并将其视为一种重要的基准测试条件;而将完整知识图谱的情况则统称为KG-全部配置方案。
在本节之后将解答这些问题:
问题1:知识图谱嵌入能否用于执行多跳知识图谱问答?(第5.3节)
请问在头实体与答案实体之间缺乏直接连接的情况下,EmbedKGQA是否仍然能够有效应对相关查询?(参考文献:5.4节)
问题3:答案选择模块对于模型的最终性能有多大的帮助?(第5.5节)
5.3 知识图谱问答(KGQA)结果
在此部分中, 我们对所提出的模型与基线模型在MetaQA和WebQuestionsSP数据集上的性能表现进行了比较研究
5.3.1 元问答分析
元问答系统针对1-3跳问题进行了分类数据集划分,在采用完整的知识图谱配置下(MetaQA KG-Full),我们的模型不仅达到了2跳任务的最佳水平,并首次实现了3跳任务的最佳水平。嵌入式知识图谱问答(EmbedKGQA)在处理1-2跳问题时表现出与当前最先进的方法相媲美,并且能够通过学习关系嵌入有效解决这些问题。相比之下,在处理两跳及三跳问题时展现出的优势则源于其能够从相邻节点推断出正确的关系连接,在这种情况下答案实体通常位于相应的问题子图中。对于Pullnet和GraftNet等模型而言也是如此
如前所述,在知识图谱(KG)设置中进行实验时
5.3.2 对WebQuestionsSP的分析
其训练数据集规模较小,并主要依赖于一个大规模的知识库(如Freebase)作为背景信息来源。这导致在进行多轮推理时会面临更大的挑战性条件判断问题,并因此变得更为复杂。由于该知识库中存在大量未被包含在当前训练集中的实体信息,在完成第4.2节的知识图谱嵌入学习后为了避免影响后续推理效果而需将实体嵌入参数予以固定 freeze处理措施成为必要选择。研究表明,在仅拥有少量训练实例的情况下 EmbedKGQA模型依然能够有效学习到高质量的问题表示并据此推导出相应的答案路径这一结果通过表3的数据支持得以充分验证

表格3基于公开可用的数据集WebQuestionsSP展示了性能。所有基准模型的结果主要基于Sun等人的研究(2019a),具体数值则反映了命中率@1。
括号中的数值涉及使用文本来补充部分知识图谱(即WebQSP KG-50)的具体参数设定。
有关更多详细信息,请参阅第5.3.2节。
我们的方法在WebQSP KG-50上显著优于所有基准模型,并且超越了PullNet这一采用额外文本信息的最新模型。尽管WebQuestionsSP的问题数量相对较少,在这种情况下EmbedKGQA仍成功地学习到了高质量的问题嵌入向量,并据此推断出知识图谱中的关联任务。这是因为通过知识图谱嵌入向量捕获的相关且必要信息得以实现,并且这种信息获取机制是隐式的。
5.4 针对缺失链接的知识图谱进行问答
基于知识图谱的大规模预训练语言模型(KGQA模型)中表现最为突出的是PullNet和GraftNet等现有模型
与之不同的是,在回答问题时,并非采用局部子图的方法而是采用知识图谱嵌入。该方法利用头节点的嵌入以及问题节点的嵌入来间接地包含了所有已观察到和未观察到的相关知识信息。这是因为知识图谱嵌入本身就具备链接预测的能力。

表4:在MetaQA 1-hop实验中对没有头实体和答案实体之间链接的QA结果进行评估,请问具体信息是怎样的?我们已经将其与基于已知问题黄金关系的知识图谱构建方法进行了对比分析。具体内容请参考第5.4节。
由此可见,在现有的问答系统架构下,并非所有问题都必须依赖实体间的直接关联关系才能被解答(如图1所示)。即使在知识图谱中未能直接建立头尾实体间的明确关联(即实体间不存在明确的关联路径),只要基于现有知识图谱提供的数据足以推断出潜在的关系(例如通过算法推理),那么我们的模型依然具备回答问题的能力。
为了考察我们的模型的能力,在MetaQA 1-hop验证集的问题中,并非所有的查询都能直接由知识图谱得出答案。我们需要从知识图谱中去除了所有可以直接用于回答这些问题的三元组。例如,在验证集中询问‘[PK]使用什么语言’的问题时,请注意我们已经排除了与之相关的(PK, in language, Hindi)这一特定关系项。此外,在数据集中还提供了相同问题的解释如‘电影[PK]是什么语言制作的’以及‘电影[PK]中使用的是什么语言’等实例。为了专注于评估模型的知识图谱补全能力而不干扰其语言概括能力,请将这些定义域相关的解释性信息移除出训练数据集
在这种情况下,在hits@1上预期仅依赖子图检索的模型将实现0次命中。然而,在这种设置下提供的结果明显优于29.9次命中@1的结果表现表现表现表现表现表现表现表现表现表现表现表现表现表现表示示示示示示示示现现现现现现现现现现现现显显显显显显显存存在在存在存在存在存在性性性性性性性性性性能力能力能力能力能力能力能力能力能力能力能能能能能力力力力力力力力力力能能能力力能能能
此外,在这种情况下
5.5 答案选择模块的影响
本研究考察了在WebQues-tionsSP数据集中答案选择模块(第4.4节)对EmbedKGQA的影响,并通过消融机制实现关系匹配。此外,在对比现有基于知识图谱邻域的方法(Sun等, 2019a;Sun等, 2018),我们将候选实体限定为头部实体的两跳邻域以进行实验对比。实验结果显示,在采用WebQSP KG-full和WebQSP KG-50两种设置情况下,关系匹配机制显著提升了EmbedKGQA的表现

表5呈现了关系匹配模块(第4.4.1节)的重要性及其在EmbedKGQA中基于邻域过滤效果的表现情况,在WebQuestionsSP数据集上进行了验证。值得注意的是EmbedKGQA系统本身整合了该关系匹配模块,在当前研究中我们考察的是在答案选择过程中去除该模块并引入两跳邻域过滤效果的表现情况;有关更多详细信息请参考第5.5节。
此外,在 entity 数量上而言, WebQSP KG (Free-base 子集) 显然超过了 MetaQA (1.8 million 与 134 thousand) 一个数量量级. 潜在的答案数量显著增加. 因此,在 WebQSP KG-Full 的情况下, 将候选答案限制在头部实体的 2 跳邻域内显著提升了性能. 然而, 这一限制导致 WebQSP KG-50 的性能出现了下降. 因为当知识图谱不完整时, 限制答案仅在 2 跳邻域内可能导致部分正确答案被排除在外, 如图 1 所示.
总体而言,在基于EmbedKGQA的方法中采取n跳过滤以选择答案对于相当完整的知识图谱可能是有益的
6 结论
本文开发了一种新型算法框架用于解决多轮推理问题,在实际应用中展现出较高的效率与准确性。传统的知识图谱由于存在数据缺失与结构不完备等问题,在进行多跳推理时会遇到较大的挑战与不确定性。针对这一困境,近期的研究者们尝试通过引入外部辅助数据集来补充这些缺陷;然而由于这些数据集往往难以满足系统的扩展需求,则导致现有方案的实际适用性受到了限制。在此背景下,在另一个研究方向上则发展出一系列基于知识图谱嵌入的方法;这类技术通过学习实体间的关联关系从而实现对知识疏漏的有效弥补;而无需依赖任何额外的数据源即可提升系统的性能表现。
具体而言;我们的方法通过巧妙地结合了实体嵌入学习机制;能够在保持原有知识完整性的同时实现对复杂对话场景下的有效推理;其核心创新点在于无需依赖外部数据即可构建起高效的多轮推理系统。
实验结果表明;在多个标准测试集上;我们的方法均取得了超越现有最先进的性能表现;这充分证明了基于知识图谱嵌入的技术特性能够为解决多跳问答问题提供有效的解决方案。
