Advertisement

知识图谱-KGC(推理补全/链接预测):图谱推理

阅读量:

一、概述

基于知识图谱框架下的推理过程主要聚焦于关系型推理这一核心环节。该过程旨在通过已有事实及关联关系推导出潜在的事实与关联,并通常会关注实体属性、各维度之间的相互作用以及整个图谱架构的特点。

具体而言, 知识图谱推理主要能辅助推导出新增的知识点、新增的连接、新增的基础理论以及新增的行为准则等。

构建一个详细且全面的知识图谱需要经过多个阶段。从知识图谱的发展周期分析可知,在不同阶段中涉及了多种推理任务。例如:

在知识图谱融合过程中存在两种核心推理任务:即实体对应与关系映射;
当执行知识补全操作时,默认情况下链接预测作为一种经典的推理手段;
冲突信息下的不一致检测也被视为一种重要的推理行为;
当系统通过提供专业知识库来支持特定查询时,默认情况下相关的知识点提取同样包含在内。

二、推理方法

知识图谱推理的主要技术手段分为两大类:

  • 基于演绎的知识图谱推理;
  • 基于归纳的知识图谱推理;

1、基于演绎的知识图谱推理

在进行演绎推理时,需要对先验信息进行明确设定。因此,在知识图谱中构建本体论知识库成为主要关注点。具体而言,涉及描述逻辑推理方式、逻辑编程推理方式、基于查询的重写推理方式以及产生式规则驱动的推理方式。

在这里插入图片描述

采用基于描述逻辑的方法:详细阐述了知识图谱中丰富的逻辑描述。这些信息不仅包括传统的实体与关系之外的内容,并且通过构建分类结构等信息进一步扩展。OWL以其严格的规范性和强大的表达能力,在知识图谱领域占据重要地位。通过严格的语法规范确保了文档语义结构的基础。因此,在这样的基础上建立的模型能够实现一系列实用的推理功能:包括概念包含分析、概念互斥性判断及属性可满足性评估等基础推理功能。

基于逻辑编程推理:这种语言以一组基于规则的知识表示为基础,并且具有很强的灵活性。它不仅支持根据不同的场景定制规则,并且能够实现用户自定义的推理过程。这一领域在研究和应用上都取得了显著进展。Datalog作为一种面向知识库和数据库设计的语言,在编写规则方面尤为简便,并且能够进行有效的推理操作。

基于语义重写推理的方法:通过语义转换技术对知识图谱进行查询。该方法分为两种情形处理:第一种情形下已构建完成的知识图谱直接用于处理相关 query;第二种情形涉及外部数据库的数据存储结构转换与整合问题(例如关系型数据库)。对于第一种情形则无需额外策略即可处理;而针对第二种情形则采用本体导向的数据访问方案(OBDA)。在执行OBDA时,系统会将多个存储层的数据库信息整合并映射成统一的知识表示框架,在此过程中会自动隐藏底层系统的具体实现细节,并专注于提供高层抽象服务以满足业务需求

基于生成式规则进行推理:生成式规则系统是一种正向演绎系统,在遵循特定机制执行相应规则的过程中能够实现目标达成。该系统体系不仅适用于自动规划问题的解决,并且在专家系统等领域的应用也取得了显著成效。一个典型的生成式规则系统由事实库、生产规则以及推理机制三个主要组成部分构成。其中的推理机制是整个系统的运作核心,在这一环节中能够对信息进行有效整合与处理以实现目标导向的任务执行。在这个过程中最常用的模式匹配技术是Rete算法这一高效方法能够快速识别符合条件的模式匹配结果,并在此基础上完成相应的逻辑推导与知识更新操作。目前市面上较为流行的基于生成式规则系统的软件平台包括Drools、Jena以及GraphDB等产品系列这些解决方案大多采用了该算法或其改进版本作为基础框架以满足复杂业务场景下的自动化需求

2、基于归纳的知识图谱推理

基于归纳的知识图谱推理主要依据是通过对知识图谱已有信息进行分析与挖掘的能力实现的。其核心依据通常是已有的三元组数据。根据不同的推理要素划分标准, 可以将知识图谱推理划分为若干类别:

  • 基于图结构的推理;
  • 基于规则学习的推理;
  • 基于表示学习的推理等;

2.1 基于图结构的推理

在知识图谱中绝大多数信息都体现两个实体之间具有特定的关系属性的事实三元组。对于这些由事实三元组构成的知识结构而言,在采用图论角度进行分析时可以将其视为带标签的有向网络其中每个节点代表一个实体、边代表存在的关系。从而能够通过构建相应的推理模型对知识图谱进行有效的推理与更新。

基于图结构的知识推理中具有代表性的是路径排序算法(PRA)。该算法通过将关系路径作为核心特征来进行推理,在解决知识图谱中的实体间链接预测问题时表现出色。由于该算法所提取的关系路径本质上等价于一种Horn clause,在计算过程中生成的路径特征能够被转换为一组逻辑规则。这不仅简化了知识表示的形式,并且便于人们深入理解知识图谱中的潜在关联。因此,在这一领域内PRA 的应用已被广泛认可。

2.2 基于规则学习的推理

遵循规则的推理在精确性和可解释性方面具有显著的优势,在知识表示与推理能力方面均展现出独特特征。遵循知识库中的现有规律和潜在模式进行数据挖掘与逻辑推理的过程中,默认假设所有观察结果均应被合理解释,并在此基础上建立合理的知识表示框架。源自早期ILP(Inductive Logic Programming)系统的AMIE系列算法通过自动化的归纳学习方法实现了对大规模知识图谱中隐含模式的有效捕捉,在这一过程中始终强调保持归纳过程的高度自动化与效率性,在实际应用中展现出显著优势,并广泛应用于各种推理场景中以提升整体性能水平。

2.3 基于表示学习的推理

基于表示学习的方法其核心理念在于确定一种映射函数 将符号形式(包括图谱中所涉及的具体实体及其关联关系)转换为向量形式 这种方法特别强调其能够有效规避"维度灾难"这一挑战 同时挖掘实体与关系间的隐含联系 并特别关注这些向量表示所具有的易于计算且效率高的特点 表示学习的主要优势体现在其能够让算法通过向量空间中的学习过程自动获取所需推理特征 经过训练后能够编码相关知识 这种方法使得不同向量空间中能有效存储和表达知识图谱的离散符号信息 因此 一旦这些信息被正确编码 则可以通过预设的向量空间进行特征分析 而无需显式进行繁琐的推理步骤

一些主流的方法包括Trans系列算法、RESCAL以及DistMult和ComplEx等模型,在节点分类和链接预测等下游任务中表现出色。

2.4 基于强化学习的推理

采用强化学习驱动的知识图谱推理作为一项前沿技术手段。在该领域具有显著影响力的主要由DeepPath和MINERVA两个系统所代表。

DeepPath的主要功能是"事实判断"(fact prediction),具体来说就是确定一个三元组是否成立。 作者将这一技术归类为一种路径搜索问题,并将其建模为序列决策过程,并采用基于策略梯度的强化学习算法REINFORCE进行求解。

三、




参考文献:
第一篇:知识图谱(五)——推理简介
第二篇:知识图谱(六)——图谱推理
第三篇:【知识图谱

全部评论 (0)

还没有任何评论哟~