Advertisement

【知识图谱学习笔记】01知识图谱简介

阅读量:

本文专门阐述其构建过程、内在逻辑及实际运用,并基于个人学习经验进行持续更新。

与其他现有基于知识的知识管理系统不同,在数据组织形式、信息处理流程以及搜索技术的具体实现上均展现了显著差异性。

知识图谱中的基本表示单元通常定义为单一实例或对象。每个实例或对象通常具备多样化的属性描述。这些实例或对象间通过关系建立联系。这些关系不仅存在于同一领域,在不同领域间也能建立起联系。为了唯一标识每个实例或对象,系统中必须赋予其唯一的身份识别码。所有实例或对象的身份识别码必须唯一无误。 owl 类型用于定义实例或对象及其间的关联结构; owl 语言提供了一种形式化的方法来描述系统的语义模型和语法规则; owl 知识库则包含了对实际系统的建模和数据集成的支持; 通过 owl 机制可以实现跨组织、跨机构的知识共享和整合; 此外, owl 技术还支持对动态变化的知识进行有效的更新维护; 因此, 采用 owl 基础构建的知识图谱体系不仅能够提高系统的可靠性和稳定性, 而且也能够增强其适应复杂变化环境的能力。

1.1知识图谱的历史简要

语义网:
语义网主要通过使用点来表示对象、概念和状态,在关系上采用弧进行连接。然而由于缺乏统一的标准句法和语义表示方式,在实际应用中不同的人可能会根据自己的需求对节点和弧线赋予不同的含义。此外该系统还规定不允许用户自行定义节点与弧线的具体意义。

Linked Data:
遵循RDF与OWL的标准,在多个领域中发布和共享数据信息。其中RDF用于描述数据元素及其关系,并通过OWL提供了标准化的方法来定义概念、属性及它们之间的关系。因此,在schema层面实现了概念映射,在对象层面则建立了直观的数据关联图谱。

Introducing the Knowledge Graph: things, not strings:
知识图谱能够深入刻画真实世界的实体及其相互关系。其中的"事物"并非单纯的"字符串"。例如,在查询"泰姬陵"这一关键词时,则蕴含着丰富的意义指向。它可以代表世界上最著名的建筑之一——泰姬陵;也可以指代格莱美奖得主创作的经典作品;或者象征着新泽西州一个具有现代感的城市形象;亦或是附近的一家印第安餐馆。值得注意的是,在大多数情况下,“事物”的意义往往难以捉摸并预判。然而,在像谷歌这样的平台中,则能够精准地识别出这些细微差别并进行分类整理。因此,在某种程度上说,“事物”的意义犹如人类对信息进行检索与分类的能力——这正是知识图谱所要展现的核心价值所在。

1.2知识图谱技术

一个知识图谱主要包含三个组成部分:构建与存储、推理过程以及相关的应用领域。在构建与存储方面,则涉及四个方面的应用:首先是基于知识表示与推理的技术开发;其次是数据的存储优化;第三是支持复杂的业务需求;最后是实现自动生成的知识库学习系统(涵盖关系学习的内容)。

其中前三个应用均源自于一些知识推理、数据库、本体及语义网,而第四个知识的自动学习,则源自于数据挖掘、NLP和机器学习等。

一般情况下, 一个知识图谱可被序列语言, 搜索引擎以及专业接口直接被分析并应用于各种场景. 此外, 在常规的信息处理领域中, 一个知识图谱也可提升诸如信息抽取与提取的相关能力. 例如: 信息抽取, 搜索, 推荐及问答等.

1.3企业中的知识图谱应用

自2012年谷歌首次提出以来,在企业领域展现出持续增长的趋势。尽管如此,在实际应用过程中依然面临诸多障碍:包括完整的知识获取环节设计、有效的知识表示形式构建、智能化的知识挖掘机制开发、系统化的知识工程方法支撑以及智能化的交互界面设计等环节;此外还包括完善的信息检索模块构建。

若干企业内部知识管理系统
开放型创新战略
企业内部微观层面的知识管理系统
市场情报分析
IBM Watson系统

全部评论 (0)

还没有任何评论哟~