论文浅尝 | Knowledge Graph Contrastive Learning for Recommendation

笔记整理:刘尧锟,天津大学硕士
动机
知识图谱已被用作一种有益的辅助信息以提升推荐系统的质量。
亮点
KGCL的亮点主要包括:
这项工作发展出了一种基于联合自我监督的学习框架,在整合知识图谱的学习机制与用户行为互动的模型上取得了显著成效,并旨在增强模型的鲁棒性以解决数据噪声以及信息冷启动问题。
我们提出了一种通用的知识引导型去噪框架KGCL(Knowledge Guided Contrastive Learning),该框架基于对比学习策略构建了跨模态自识别监督机制。通过理论分析表明,在综合学习目标下能够显著提升模型性能。
(3)在三个不同公共数据集上进行了系列实验对比,在各种不同配置下该系统均表现出了显著的优势和竞争力。通过系统性的消融实验验证了我们关键组件的有效性与必要性
概念及模型
MCCLK由三个核心模块构成:第一部分是基于关系感知的知识融合机制,在此过程中我们开发了一种基于关系感知的知识嵌入层;第二部分是针对知识图谱增强的方法进行了创新,在这一环节中我们通过外部数据集的语义关联性实现了跨模态数据的自监督学习;第三部分是以改进后的知识图谱增强方法为基础构建了新的对比学习框架,并将其与传统的图神经网络架构相结合以期达到更高的模型性能水平。
模型整体框架如下:

l关系感知知识聚合****
为了解决知识图谱上手动设计路径生成这一限制问题, 我们的 KGCL 通过将实体及其关联关系映射至具有参数化注意力矩阵的特定表示中, 实现了一种自动化的路径生成方法. 为此, 在 Gk 中构建了基于连接实体的消息聚合机制, 该机制能够有效整合不同模态的信息并利用异构注意力聚合器自动生成知识感知项目的嵌入表示.

此外,在关系感知知识聚合器与 TransE 之间实施替代训练以进一步加强实体-项目依赖关系的多关系语义表示空间。这种基于翻译的知识图嵌入的方法论基础在于使头部与关系嵌入之和与尾部表示保持高度一致。我们采用一种基于 L1 范数定义的相似性度量函数用于表征嵌入向量之间的相似性。这种基于翻译的优化损失 L:

l知识图谱增强
在我们的 KGCL 框架中, 我们建议通过实体方面的自我辨别生成不同的知识图结构视图, 用于对比学习. 尤其是在输入知识图谱上采用随机数据增强方案来生成两个相关的数据视图. 然后, 导出单个项目的知识图结构一致性, 以反映项目对知识噪声扰动的不变性. 为此, 我们因此在知识图结构上设计了数据增强算子如下:

为了解析基于增强视图的每个项目的一致性属性, 本研究提出了项目i的知识图结构一致性C_i及其与其他视角编码表示的一致性框架.

l知识引导的对比学习
基于图的协同过滤框架和一种关系感知的知识融合机制被用来对用户的表示以及项目的表示进行编码。鉴于LightGCN[11]算法具备良好的有效性并拥有简洁高效的架构设计特点,在处理用户-项目交互数据时采用了其消息传递策略来捕获协作信息的效果。

损失如下:



理论分析
实验
研究者基于三个公共数据集展开实验。其中首要的是有效性评估。其性能评估指标包括Recall和NDCG。

在所有指标方面,KGCL在三个数据集上始终优于所有baseline。
通过比较KGCL和两种变体来检查模型中主要组件对最终性能的贡献:
•w/o KGA:KGCL的一个变体,在用户-项目交互图中缺乏增强的知识导向方案。相比之下,对比视图是通过随机边采样生成的,并用于计算互信息.
Without the knowledge graph component for KGCL, we remove the contrastive learning module from KGCL and transmit directly to the graph-based CF framework for comparison.
图3报告了两种变体和KGCL的结果。

基于类似设置生成稀疏用户集,在面对具有较少互动的数据集时评估 KGCL 的稳健性。其中 Yelp 2018 和 Amazon Book 数据集的互动次数均低于 20 次;而 MIND 数据集仅达到不超过5次的日均互动水平。图 6 显示了在不同数据规模下的实验结果。

为了验证KGCL算法在长尾场景推荐系统中的表现, 我们将所有的参与项划分为五个规模相等的组别, 根据交互强度的不同将参与项划分为五个组别(从第0组到第4组)。分别对各组别进行性能评估, 最终的结果已如图5所示。

总结
在本研究中, 提出了一种名为KGCL的新框架,它基于对比学习范式,致力于探索知识图语义以及缓解推荐系统中数据噪声的问题。通过估计知识模糊项目对用户偏好学习的影响,我们进行了KG感知数据增强,从而获取辅助自我监督信号。这项研究为知识感知推荐系统开辟了新的研究方向。与现有最新方法相比,经过大量实验验证,KGCL在多个真实世界数据集上的表现均优于现有方法
OpenKG
OpenKG(中文开放知识图谱)致力于推进基于中文的知识图谱数据的开放共享与互联互通,并同时致力于促进相关技术与基础设施的开源发展。

点击阅读原文 ,进入 OpenKG 网站。
