Advertisement

第一章 知识图谱概述

阅读量:

知识图谱的基本概念

协议的知识图谱特指一类特定的知识表示方式,在本质上构成一种规模宏大的语义化网络。广义的知识图谱则被概括性地称为大数据时代背景下知识工程领域的核心技术集合,在某种程度上代表了新领域的大数据知识工程这一前沿学科

知识图谱的狭义概念

1、知识图谱作为语义网络的内涵

作为知识表示的一种形式,在大规模语义网络中被定义为一种特定的知识图谱结构,并且它包括实体、概念以及它们之间的各种语义关联

知识图谱概念

其为语义网络, 构成了知识图谱的核心。
其具有规模性, 这体现了两者在规模构建上的本质差异。

语义网络是以图形化形式利用点与边来表示知识的一种方式。(例如,在使用图数据库进行存储时应该考虑到这一点)其中的基本构成单位包括节点和关系。这些节点可以代表实体、概念以及具体的数值信息。

  • 对象或实例有时也被视为实体(Entity),它们具有独特的标识符。
  • 概念通常被称为类型(Type)、类别(Category)或类(Class),用于分类和组织数据。
  • 每个实体都包含一组属性值,这些值决定了其特性和行为。

应该借助三元存储模型来理解语义网络的结构,应该能更快有收获

知识图片与传统语义网络的区别

优点:

  1. 规模宏大:知识图谱具有庞大的规模。例如,在Google知识图谱发布初期就已收录近5亿个实体以及超过20亿的关系。由于其强调对实体的全面覆盖特性,在数据量上呈现出显著的优势。
  2. 信息量丰富:一、知识图谱承载着丰富的语义信息,在DBpedia等实例中已包含数百种常见的语义关系类型。通过将不同语义关系相互连接在一起,则能够基本覆盖现实世界中存在的各种常见语义关联。二、语义关系的建模具有多样性,在具体应用中一个语义关系不仅可以被赋予一定的权重或概率属性来增强表达能力。
  3. 高度可靠:知识图谱是大数据时代的重要产物,在多源数据特性下可以通过多种途径验证简单事实。
  4. 架构简便:知识图谱通常采用三元组的形式进行表示,在实际应用中这形成了典型的图结构模型。值得注意的是,在RDF框架下这种三元组表示方法同样被广泛应用。

缺点:

  1. 高质量模式的缺失:提升知识图谱的规模往往会付出质量方面的代价。为了让更多知识入库,势必要适当放宽对知识质量的要求:也就是允许模式(Schema)定义不完善,甚至缺失。模式定义不完善或者确实对知识图谱中的数据语义理解以及数据质量的控制提出了挑战
  2. 封闭世界假设不再成立:传统数据库与知识库的应用通常简历在封闭世界假设(Closed World Assumption,CWA)基础上,CWA界定数据库或知识库中不存在的事实即为不成立的事实;但在开放性应用中不遵守这个假设:在这些应用中缺失的事实或知识不一定为假
  3. 知识图谱与本体的区别:人工智能领域提出本地的一个重要动机是,知识的共享和复用,以及数据的互联与互通。不同的自治系统只有遵循相同的"世界观",才可能形成类似的"理解"。语义网(SemanticWeb)领域发展除了很多本体定义语言与资源交换标准。因此计算机领域的本体侧重于表达认知的概念框架,表达概念之间的予以关系,往往也伴随着刻画概念的公里系统。本体刻画了人们认知一个领域的基本框架。在建设知识图谱的初期,模式(Schema)定义实质上在完成本体定义的任务

知识图谱的广义概念

知识图谱被视为一个综合性的技术架构,在大数据时代的知识工程领域中代表了核心支撑技术和基础理论体系的集合。

作为一门学科的知识图谱归类于人工智能领域。人工智能的核心目标是使机器具备像人类一样具有理性思维的能力或具备形式推理能力;在知识工程领域的主要内容是构建专家系统,以便使机器能够借助专家知识和推理技术来解决现实中的具体问题。

在整个现代知识工程领域中

知识图谱历史沿革

讲述知识图谱的历史,不记笔记

知识图谱的研究意义

知识图谱是认知智能的基石

  1. 知识图谱使机器具备对语言的理解能力。认知智能的核心技术之一是实现自然语言处理任务的逻辑基础。
  2. 知识图谱为可解释性人工智能的发展提供技术支撑。
  3. 知识有助于提升机器学习模型的性能。

知识引导称为解决问题的重要方式之一

知识图谱的应用价值

数据分析

大数据的精准与精细分析需要知识图谱

智慧搜索

探索未来的发展方向时,所有领域均可纳入检索范围,并且这一目标必须实现。为有效应对这些挑战,在构建知识体系方面需投入大量资源来开发和维护各类知识库。

智能推荐

自然人机交互

决策支持

知识图谱分类

知识图谱中的知识分类

  1. 事实性知识(Factual Knowledge)。即指围绕特定实体的基础信息。
  2. 分类式知识(Taxonomy Knowledge)主要包含两种类型:其一是实体与其类别间的从属关系;其二是子类别间的关联。
  3. 词汇性Knowledge(Lexical Knowledge)涵盖了实体与其相关词汇间的关系及其相互作用。
  4. 常识性Knowledge (CommonsenseKnowledge)。人类在感知世界的过程中形成的丰富经验被称为常识性Knowledge 。它具有广泛性和普遍性特征,在日常交流中这些信息无需额外说明即可被理解。由于其普遍性和基础性特点,在文本处理过程中往往不易直接提取。常见的Knowledge Sources包括Cyc和ConceptNet等资源。

知识图谱的领域特性

近年来,在其应用与发展过程中逐步从通用领域向特定领域及特定行业迁移,在这一进程中便逐渐形成了领域或行业的知识图谱(Domain-Specific Knowledge Graphs, DKGs)。相较于这一概念而言,GKG(General-Purpose Knowledge Graph, 通用知识图谱)在主要差异及其关联方面具有显著特征

DKG与GKG的区别 | | | DKG| GKG |

--- --- --- ---
深度
粒度
知识获取 质量要求 苛刻
专家参与 重度 轻度
自动化程度
知识应用 推理链条
应用复杂性 复杂 简单

DKG与GKG的关系体现在以下

  1. 领域知识是通过隐喻或类比建立在通用知识的基础之上
  2. GKG和DKG相互支撑下形成:基于这些高质量的基础事实进行抽取出模型训练所需的样本数据;同时作为样本数据指导提取与建模训练的基础材料。此外,在构建过程中还需要考虑其对知识体系结构的影响。

越来越多的企业开始重视自身的企业知识图谱建设与应用。
由此催生了概念化的'企业知识图像'(Enterprise Knowledge Graph)。
而'企业知识图像'则指的是贯穿于企业在各个关键业务环节的知识图表。
相比于现有的DKG和GKG系统,在'精小、宽杂、强专用'的特性下。
在'精小'方面:企业的语料或数据量相对缩减较多。
导致难以高效训练相应的知识获取模型。
在'强专用性'方面:每个企业在具体的业务模式上有其独特的特色。
在'宽杂'方面:企业的 knowledge 图表 覆盖了多个不同的行业领域。

典型知识图谱

  1. CYC知识库
  2. WordNet数据库
  3. GeoNames系统
  4. Google知识图谱
  5. Probase系统
  6. 搜狗知立方平台
  7. 百度智能问答系统
  8. CN-DBpedia网络

全部评论 (0)

还没有任何评论哟~