Advertisement

深度学习--知识图谱

阅读量:

知识图谱

软件知识的来源:

源代码、邮件列表、缺陷报告和回答文档

软件爆炸过程中面临的问题:

1:复用者的学习成本越来越高

2:不同类型的软件知识的特征不同

3:从不同类型的软件中提取出的软件实体之间的关联错综复杂

提出软件知识图谱方面的知识!

定义:软件知识图谱是指通过不同类型软件资源的复用与有机融合而构建的知识体系;其中的软件知识图则通过同一类型软件资源中提取的知识实体及其间的关联关系进行整合为一个系统的知识图形表示;而软件知识实体则特指能够明确标识并具有独立意义的软件资源单元;其间的关联关系则描述了两个及以上此类实体之间的特定语义关联。

目前已经做的工作:

Hipikat(系统)为一个指定项目收集(获取)资源,并解析各类资源之间的关联关系(不同类别),构建了项目的资源数据库(库)。使用者可以在该数据库中进行查询(检索),系统会返回与所选相关文本相似度较高的多种资源及其之间多个的关系(关联关系),方便使用者学习理解。然而 hipikat (针对每一类)软件 资源仅提取了相应的信息内容(内容),未进行进一步的知识处理或分析

Gopinath [5]基于软件项目的代码库提取包、类、接口及方法信息,并构建了项目以及相关的包、类、接口和方法等本体基础。随后将所有项目的本体整合至统一的本体网络中以便于开发者复用现有的软

3:McMillan [6] 开发了一种展示代码中各函数之间调用关系的图形表示法,在源代码分析工具中旨在协助用户查询相关的方法/函数及其实际应用案例或示例说明。

DBPedia 为个人用户提供了对维基百科相关资源进行语义化查询的能力。而谷歌的知识图谱则旨在将谷歌索引涵盖的广泛事物、人物及地点抽象为独立的实体,并通过构建相互联系的方式连接这些实体。

问题分析:

基于属性图模型的知识表示方式可以有效组织节点及其关联信息。在该模型中,每一个节点都对应于一个特定的软件知识实体,而系统中各节点之间的有向边则反映了语义关联。其键值对一一对应于相关节点的属性信息,所有节点及关联关系均通过唯一的全局标识符加以区分。

解决方案:

1:软件知识提取

2:构建软件知识实体联系,并对多类型软件资源单独的知识图进行有机整合,最终构建起完整的知识图谱

3:最后建立知识检索与展现机制

全部评论 (0)

还没有任何评论哟~