A Re-evaluation of Knowledge Graph Completion Methods

阅读量：

研究问题

研究表明，在过去几年中的一些前沿模型在性能上的提升部分得益于评估机制中的偏差。研究发现，在过去几年中的一些前沿模型在性能上的提升部分得益于评估机制中的偏差。研究发现，在过去几年中的一些前沿模型在性能上的提升部分得益于评估机制中的偏差。

论文里的一些观察

最近的研究表明多种方法均在某一特定数据集上显示出了显著的进步；然而，在另一个测试集合上的改进则较为有限。如图所示，默认采用 convE 作为基准进行比较实验时发现：非神经网络架构在网络规模较小（如 WN-18）的数据集中表现相对较好；而在 FB-2017（FB）的数据集中表现优异；但回到 WN-18（WN）的数据集中，则出现了性能下降的情况。

论文对近期提出的几种神经网络模型的三元组 scoring 函数分布进行了考察，在深入分析后发现了一些有趣的现象：即在某些负采样 triple 中其 scoring 值与对应的正类 triple 的 scoring 值完全相同。以图中的例子为例，值得注意的是，在这些 triple 中数值越小越好，在该图表中用红色虚线标注了正类 triple 的 scoring 值。结果表明，在这些负类 triple 中 majority 与正类 triple 具有相同的 scoring 值

研究者对现有多种模型进行了全面对比分析，并发现ConvKB和CapsE在多个三元组上表现优异

原因分析

如图所示，在论文中绘制了不同三元组经过ReLU激活函数作用后变为零的比例情况。经观察发现，在基于神经网络的模型中存在大量神经元被激活函数置零的情况。这使得许多三元组获得了相似的表现并最终获得了相同的评分结果。值得注意的是，在论文中这里讨论的内容就结束了。我认为这可能源于FB和WN数据集特性的差异性——即在这种情况下尽管模型学到了相近的分数值但FB性能显著提升而WN性能却明显下降

实验部分

对候选三元组进行排序

论文对比了三种不同的对候选三元组进行排序的方式，在这一研究中提出了三种排序策略：一种是将正确识别的三元组排列在最前位置（记为TOP），另一种是将正确识别的三元组安排到最后（记为BOTTOM），第三种则是采用随机排序的方法（记为RANDOM）。随后针对不同模型采用了上述不同排序策略并进行了实验验证，在两个典型数据集上展开了评估分析。

基于实证研究发现，在ConvKB、CapsE以及KBAT等模型的基础架构中主要采用了TOP排序方法；而其他几种模型则采用了随机排序方法。研究表明，在引入新的统一排序策略后，在神经网络模型中能够明显地呈现出来，并且其性能显著下降。

全部评论 (0)

还没有任何评论哟~

A Re-evaluation of Knowledge Graph Completion Methods

研究问题论文指出近年来的几种最佳模型取得的效果提升有一部分来源于评估方式的误差，该指标下即使模型保持输出一个常数也能得到不错的结果，并提出了一种新的评估指标对模型进行了重新评估。

《Do Pre-trained Models Benefit Knowledge Graph Completion? A Reliable Evaluation and a Reasonable A》

文章标题：《DoPretrainedModelsBenefitKnowledgeGraphCompletion? AReliableEvaluationandaReasonableApproach》A...

Do Pre-trained Models Benefit Knowledge Graph Completion?A Reliable Evaluation and a Reasonable App

摘要近年来，预训练语言模型PLMs已被证明可以从大量文本中捕获事实知识，这鼓励了基于plm的知识图完成KGC模型的提出。然而，这些模型在性能方面仍然远远落后于SOTAKGC模型。在本工作中，我们发现...

Robust Knowledge Graph Completion with Stacked Convolutions and a Student Re-Ranking Network

研究问题创建了稀疏连接的知识图谱数据集，并研究如何在稀疏连接的知识图谱上完成链路预测任务背景动机目前常用的知识图谱补全数据集都是基于稠密连接的假设创建的，比如FB15K数据集创建时就只包含至少有...

Analysis of Negative Sampling Methods for Knowledge Graph Embedding

摘要负采样是一种用于加速知识图嵌入学习和最大化嵌入模型在链接预测和实体解析等支持任务中的有效性的方法。负采样对于提高准确性、减少偏差、提高效率和改善代表性至关重要。本文仔细研究了在基准数据集Fb15...

GraphEval: A Knowledge-Graph Based LLM Hallucination Evaluation Framework

文章目录题目摘要引言问题陈述相关工作 GraphEval:我们的评估方法使用LLM构建知识 GraphCorrect:使用GraphEval纠正幻觉实验讨论结论题目 GraphEv...

Unlock the Power of Frozen LLMs in Knowledge Graph Completion

文章目录题目摘要引言方法实验相关工作结论局限性附录题目在知识图完成中释放冻结LLM的力量论文地址：https://arxiv.org/abs/2408.06787 摘要传统的...

【Convolutional Network Embedding of Text-Enhanced Representation for Knowledge Graph Completion】

《文本增强表示的CNN嵌入：ConvolutionalNetworkEmbeddingofTextEnhancedRepresentationforKnowledgeGraphCompletion》阅...

A Survey on Application of Knowledge Graph

本文是针对《ASurveyonApplicationofKnowledgeGraph》的一个翻译。知识图谱应用综述摘要 1\.引言 2\.应用 2.1问答系统 2.1.1基于语义分析 2.1.2基...

Knowledge Is Flat: A Seq2Seq Generative Framework for VariousKnowledge Graph Completion

摘要近年来，知识图谱补全KnowledgeGraphCompletion,KGC已扩展到多个知识图谱结构，并开创了静态知识图谱、时态知识图谱和少量知识图谱等新的研究方向Jietal.，2022。

是否确定退出登录?

A Re-evaluation of Knowledge Graph Completion Methods

研究问题

论文里的一些观察

原因分析

实验部分

全部评论 (0)

相关文章推荐

A Re-evaluation of Knowledge Graph Completion Methods

《Do Pre-trained Models Benefit Knowledge Graph Completion? A Reliable Evaluation and a Reasonable A》

Do Pre-trained Models Benefit Knowledge Graph Completion?A Reliable Evaluation and a Reasonable App

Robust Knowledge Graph Completion with Stacked Convolutions and a Student Re-Ranking Network

Analysis of Negative Sampling Methods for Knowledge Graph Embedding

GraphEval: A Knowledge-Graph Based LLM Hallucination Evaluation Framework

Unlock the Power of Frozen LLMs in Knowledge Graph Completion

【Convolutional Network Embedding of Text-Enhanced Representation for Knowledge Graph Completion】

A Survey on Application of Knowledge Graph

Knowledge Is Flat: A Seq2Seq Generative Framework for VariousKnowledge Graph Completion