Exploring Large Language Models for Knowledge Graph Completion

阅读量：

文章目录

- 题目
- 摘要
- 简介
- 相关工作
- 方法
- 实验
- 结论
- 局限性
- 例子

题目

探索用于知识图谱补全的大型语言模型

论文地址：https://arxiv.org/abs/2308.13916
项目地址： https://github.com/yao8839836/kg-llm

摘要

在众多人工智能领域中, 知识图谱扮演着极其关键的角色, 但它们常常面临着数据完整性方面的挑战. 本研究致力于运用大型语言模型 (LLM) 来构建或完善知识图谱. 我们将知识图中的三元组视为文本序列, 并提出了一种名为 KGLLM 的创新框架来建模这些三元组. 这种方法采用提示机制, 利用生成响应来进行预测. 通过多个基准测试, 我们的系统展现出超越现有方法的性能水平. 此外, 微调规模较小的模型（如 LLaMA-7B 和 ChatGLM6B）比近期流行的 ChatGPT 和 GPT-4表现出更好的效果.

简介

大型知识图谱（KG），例如Freebase（Bollacker等学者于2008年）、YAGO（Suchanek等学者于2007年）以及WordNet（Miller 1995），为众多关键的人工智能任务提供了坚实的支撑。这些包括语义搜索、推荐系统（Zhang等人于2016年）以及问答系统（Cui等人于2017年）。
通常情况下，知识图谱表现为多关系网络结构，在此架构中以节点代表实体、边表示实体间的关联。每条边都被描述为一个三元组（头实体、关系、尾实体）的形式（简记作(h,r,t)），用来表示两个实体之间的关联。尽管知识图谱在很多方面表现得非常出色，在此领域仍存在诸多未完善之处。

许多研究致力于探索知识图谱补全的方法。目前广泛采用的知识图谱嵌入方法主要基于观察到的三元组事实的结构信息，并因此导致数据稀疏性问题。近年来的研究们发现整合文本信息有助于提升知识表示能力，并提出了多种融合策略（Socher et al, 2013; Xie et al, 2016; Xiao et al, 2017; Wang and Li, 2016; Xu et al, 2017; An et al, 2018）。我们之前的icularly KG-BERT模型（Yao et al., 2019）首先通过预训练语言模型BERT（Devlin et al., 2019）来编码先验知识和语境信息。值得注意的是，在效率和性能方面扩展了 KG-BERT 模型的最新研究表明，在效率和性能方面扩展了 KG-BERT 模型

最近的研究表明（Zhao et al, 2023）如ChatGPT和GPT-4（由OpenAI开发）等大语言模型受到了学术界的广泛关注。（此处"关注"替换为"受关注"使其更加正式）

在本研究中,我们引入了一种基于大型语言模型的知识图谱补全创新方法.具体而言,我们将实体、关系及三元组被视为文本序列,并将知识图谱补全建模为基于序列的输入输出问题.为此,我们采用开放式LLM框架（包括LLaMA项目(Toutron等人,2023)和ChatGLM项目(Du等人,2022)）来处理这些文本序列,并根据其生成结果评估三元组或候选实体/关系的有效性.该方法已在多个知识图谱完成任务中展现出显著优势.完整的源代码已在GitHub上公开.我们的主要贡献包括:

本研究开发了一种新型的语言建模技术以支持完整知识图谱的构建。据我所知，在这一领域中尚未有其他系统性地将大型语言模型应用于知识图谱补充的任务。
在多个基准测试中进行的结果分析表明，在三元组分类以及关系预测任务上我们的方法表现出了卓越性能。

我们还进行了研究发现,对规模较小的模型（例如 $LLaMA-7B$ 、 $ChatGLM-6B$ ）完成微调训练能够超越了当前主流的大模型架构。

方法

在本章中阐述了知识图谱补全的任务及其相关工作方法

提示格式将是"Steve Jobs 和 Apple Inc. 之间的关系是什么？请从下面提供的选项中选择您的答案：出生于 | 成立 | 是公民 | ... | 办公地址."而期望的答案将是"Steve Jobs 创立了 Apple Inc." 实体（链接）预测任务。给定一个头实体和一个关系，在这种情况下是"史蒂夫·乔布斯"与"创立"的关系，请预测与之相关的尾实体，在这种情况下是"苹果公司". 实体（链接）预测任务分为两种类型：一种是给定一个头实体和一个关系，在这种情况下是"史蒂夫·乔布斯"与"创立", 请预测与之相关的尾实体, 在这种情况下是"苹果公司"; 另一种是给定一个尾实体和一个关系, 在这种情况下是"苹果公司", 请预测其对应的头实体, 在这种情况下是"史蒂夫·乔布斯". 实体（链接）预测任务询问的方式有五种类型："史蒂夫·乔布斯创立", "苹果公司成立", "谁/什么创立苹果公司", "为什么苹果公司被创立", "在什么地方苹果公司被创立". 理想的回答应该是"史蒂夫·乔布斯创立了苹果公司."

为了实现KG与LLM的有效结合，在知识图谱领域具有重要研究价值的前提下

图 1：用于知识图谱（KG）补全的大型语言模型（LLM）图示。

实验

数据集与设置部分

表 2：多样化的方案在 FB13 数据集上展示了各算法在三种粒度级别的三重分类精确度（百分比）。其参考数据来源自相关文献。
表 3：基于 FB13 数据集的 100 个测试样本中展示了不同 LLM 在三种粒度级别的三重分类精确度。

我们对多种KG嵌入方法进行了系统对比分析：包括TransE及其扩展形式（如TransH、TransD、TransR、TransG和TranSparse）（Wang et al, 2014b; Ji et al, 2015; Lin et al, 2015; Xiao et al, 2016; Ji et al, 2016），神经张量网络NTN（Socher et al, 2013），以及Dist-Mult及其扩展形式DistMult-HRS（Zhang et al, 2018）。此外，还探讨了基于上下文的KG嵌入模型DOLORES（Wang et al, 2018）；包含文本信息的KG嵌入TEKE（Wang and Li, 2016）、DKRL（Xie et al, 2016）[采用BERT编码器]以及AATE（An et al, 2018）。同时研究了预训练语言模型领域相关的方法：如KG-BERT（Yao et al, 2019）、StAR（Wang et al, 2021）、KGT5（Saxena et al, 2022）和KGLM（Youn and Tagkopoulos, 2023）。最后将这些方法与ChatGPT和GPT-4进行了性能对比

对于 ChatGLM-6B 的指令调整与推理功能, 本研究采用了其公共实现中的默认参数设置方案。在LLaMA 模型的配置中, 本研究采用了 Transformers Python 库的具体实现方案。为了方便查阅详细信息, 完整的内容可以在我们的源代码库中获取。对于 KG 完成模型部分, 则采用了其原始论文的结果数据或通过其官方实现还原出相应配置方案;而对于 KGT5 模型来说, 则基于我们自定义化的提示输入与响应输出机制进行了训练, 在其他配置方面则保持了与官方实现一致的设定;最后将自定义化的提示内容导入到 GPT-4 以及 ChatGPT 的在线界面系统中以获取最终结果。

表格 2 展示了 WN11 和 FB13 数据集上的三重分类模型准确率数据。当基础事实成立且响应包含肯定用语（如'是'）时，在被评估实例中生成肯定判断；当基础事实成立但生成否定判断（如'否'），或者基础事实不成立但生成肯定判断时，则在被评估实例中生成否定判断。我们发现 LLaMA-7B 和 LLaMA-13B 在这两个基准数据集上的性能均未达到预期目标。然而，在特定知识图谱推理任务中接受过专门训练后（即处理 KG 数据时），KG-LLaMA 的性能表现出了显著提升效果。具体而言，在 KG-Llama2-7B 基础模型上经过优化后，在 KG-Llama2-7B 基础模型上表现最为突出，在 KG 数据集上取得了最佳的分类准确率数据。表 3 则展示了不同 LLM 模型在 FB13 测试集上的具体分类准确率数据对比情况：通过人工评估不同 LLM 的回答质量，并将每条测试实例的结果标记为正确或错误；最终统计结果显示 KG-Llama2 模型在 Fibre 等类别的推理能力上有明显优势，并且其性能表现与 GPT-4 接近并略占优胜

表 4 列举了多种方法下实体及其对应的链接进行预测的结果指标为 $Hits@1$ 。
表 5 列出了各关系间的预测评估得分为 $Hits@1$ 。

表4比较了多种预训练语言模型在WN18RR与YAGO310上的link prediction hit rates@1值。这些数值是首实体与尾实体的平均得分。对于LLM而言当其回答包含标签词则被判定为正确答案结果表明我们的方法显示出有潜力的表现因为KGLLaMA因指令转换而展现出显著的提升效果结合知识结构信息也能显著提高结果水平

表 6：不同 LLM 的示例输出。第一行取自 FB13-100，第二行取自 YAGO3-10-100。

表6展示了当输入内容一致时LLM与KG-LLM之间的响应差异。我们发现原始模型的回答不尽如人意，并通过指令调整可以让模型学习模仿训练三元组的方式并更加深入地理解事实。1）.相较于仅具有少量预训练语言模型能力的系统来说LLM积累了更为丰富的通用知识。2）.通过指令调整我们成功弥补了LLM在预训练权重与KG三元组描述之间的知识缺口

结论

在本文中, 我们开发了一种创新性的KG-LLM方法. 该方法在多种知识图谱补全任务中实现了卓越的SOTA性能分类及关系预测. 我们计划将KG-LLM作为具备知识增强功能的语言模型应用于多个NLP领域. 我们致力于优化现有的LLM快速构建技术.

局限性

虽然现有方法在利用LLM完成KG方面已展现出良好的效果,但目前该方法在处理仅凭实体或关系描述而缺乏实体名称或描述的KG时仍存在不足.此外,我们尚未充分利用高阶KG结构信息,这可能显著改善结果,尤其是在实体预测任务中

例子

全部评论 (0)

还没有任何评论哟~

Exploring Large Language Models for Knowledge Graph Completion

文章目录题目摘要简介相关工作方法实验结论局限性例子题目探索用于知识图谱补全的大型语言模型论文地址：https://arxiv.org/abs/2308.13916 项目地址：h...

Relations Prediction for Knowledge Graph Completion using Large Language Models

文章目录题目摘要简介相关工作方法论实验结论局限性未来工作题目使用大型语言模型进行知识图谱补全的关系预测论文地址：https://arxiv.org/pdf/2405.02738...

Making Large Language Models Perform Better in Knowledge Graph Completion

MakingLargeLanguageModelsPerformBetterinKnowledgeGraphCompletion 基本信息博客贡献人鲁智深作者 YichiZhang,ZhuoCh...

Making Large Language Models Perform Better in Knowledge Graph Completion

文章目录题目摘要引言相关著作基于LLM的KGC的基本设置方法实验结论题目使大型语言模型在知识图完成中表现更好论文地址：https://arxiv.org/abs/2310.066...

Contextualization Distillation from Large Language Model for Knowledge Graph Completion

文章目录题目摘要简介相关工作语境化提取实验结论限制附录题目用于知识图完成的大型语言模型的语境化提取论文地址：https://aclanthology.org/2024.find...

KICGPT: Large Language Model with Knowledge in Context for Knowledge Graph Completion

文章目录题目摘要简介相关工作方法实验结论附录题目 KICGPT:用于知识图完成的带上下文知识的大型语言模型论文地址：https://aclanthology.org/2023.fi...

Biomedical knowledge graph-enhanced prompt generation for large language models

1\.生物医学知识图谱增强大语言模型提示生成论文地址：[[2311.17330]Biomedicalknowledgegraphenhancedpromptgenerationforlargelan...

Multi-Task Learning for Knowledge Graph Completion with Pre-trained Language Models

研究问题以多任务形式训练KGBERT 背景动机 KGBERT在MRR和Hit@k上效果不好，论文认为是由以下两个因素导致的： KGBERT以三元组分类的任务微调预训练模型，这就无法充分利用关系的信息...

Making Large Language Models Perform Better in Knowledge Graph Completion论文阅读

文章目录摘要 1.问题的提出引出当前研究的不足与问题 KGC方法 LLM幻觉现象解决方案 2.数据集和模型构建数据集模型方法基线方法任务模型方法基于LLM的KGC的知识前缀适配器知...

Leveraging A Medical Knowledge Graph into Large Language Models for Diagnosis Prediction

本文是LLM系列文章，针对《LeveragingAMedicalKnowledgeGraphintoLargeLanguageModelsforDiagnosisPrediction》的翻译。

是否确定退出登录?

Exploring Large Language Models for Knowledge Graph Completion

文章目录

题目

摘要

简介

相关工作

方法

实验

结论

局限性

例子

全部评论 (0)

相关文章推荐

Exploring Large Language Models for Knowledge Graph Completion

Relations Prediction for Knowledge Graph Completion using Large Language Models

Making Large Language Models Perform Better in Knowledge Graph Completion

Making Large Language Models Perform Better in Knowledge Graph Completion

Contextualization Distillation from Large Language Model for Knowledge Graph Completion

KICGPT: Large Language Model with Knowledge in Context for Knowledge Graph Completion

Biomedical knowledge graph-enhanced prompt generation for large language models

Multi-Task Learning for Knowledge Graph Completion with Pre-trained Language Models

Making Large Language Models Perform Better in Knowledge Graph Completion论文阅读

Leveraging A Medical Knowledge Graph into Large Language Models for Diagnosis Prediction