知识图谱导论(二)知识图谱概览
【课程笔记基于浙江大学陈华钧老师的课件学习呢】
万维网 :以链接为中心的信息系统
语义网 :以数据为中心的信息系统
1. 知识图谱的起源
谷歌的知识图谱(Things not Strings)-2012
2. 知识图谱概念的演变
1960年 语义网络 (Semantic Networks)语义网络作为知识表示的一种方法被提出,主要用于自然语言理解领域
1980s 本体论 (Ontology)哲学概念本体被引用到人工智能领域用来刻画知识
1989年 万维网 被发明
1998年 语义网 (从超文本链接到语义链接)
2006年 链接数据 (Linked Data),万维网创始人Tim强调语义网本质是建立开放数据之间的链接
2012年 知识图谱 (Knowledge Graph),谷歌发布了基于知识图谱的搜索引擎产品
知识图谱得益于Web的发展(主要是数据方面),有着来自知识表示,自然语言处理,Web和人工智能多个方面的基因。
3.各种语义网项目
Freebase :http://www.freebase.be/
PKUBase :包含130万以上实体、超过1300万知识条目的中文RDF语义知识库 ,由北京大学大数据研究院开发
LinkingOPENData :
zhishime :通过从开放的百科数据中抽取结构化数据,首次尝试构建中文通用知识图谱。目前,已融合了三大中文百科,百度百科,互动百科以及维基百科中的数据。www.openkg.cn/dataset/zhishi-me
Schema.org :一系列可扩展的 schemas 标记集合
WIKIDATA :一个可协同编辑的知识库
DBpedia :一个很特殊的语义网应用范例,它从维基百科(Wikipedia)的词条里撷取出结构化的资料,以强化维基百科的搜寻功能,并将其他资料集连结至维基百科
cnDBpedia :中文通用百科知识图谱 ,由复旦大学知识工场实验室研发并维护的大规模通用领域结构化百科 http://openkg.cn/dataset/cndbpedia
YAGO :多语言知识库(包含中文) OpenKG收集和整理国内国外重要的开放知识库和知识图谱项目,并组织整理相关的中文资料免费对外开放
4.知识图谱的作用
语义搜索
问答交互
大数据分析
语言理解
设备抽象与语义互操作
5.知识图谱的技术体系
做知识图谱本质是做数据,知识图谱的表达更加规范,数据链接更加紧密的数据
KG技术要素
KG构建
知识表示
#Schema/Ontology
#RDF/OWL/JSON-LD
#KG Embedding
知识存储
知识抽取
#概念抽取
#实体识别
#关系抽取
#规则抽取
#事件抽取
知识融合
#实体对齐
#实体消岐
#本体对齐
知识补全
#属性填充
#关系预测与推理
KG利用
语义搜索
智能问答-KBQA
#语义解析
#实体链指
数据分析-可视化分析
视觉理解
推荐计算

知识=精炼的数据
5.知识图谱VS知识库VS数据库

