Advertisement

Knowledge Graph Contrastive Learning for Recommendation(KGCL)阅读笔记

阅读量:

现有知识图谱(KG)在稀疏性及噪声的影响下,
导致项目-实体之间的依赖关系偏离真实地反映其特征,
从而显著放大了噪声效应,
阻碍了用户偏好信息的准确表示。
为了填补这一研究空白,
作者设计了一个通用的知识图对比学习框架(KGCL),
以减少知识增强推荐系统中的信息噪声。

论文链接:https://doi.org/10.1145/3477495.3532009

代码链接:https://github.com/yuh-yang/KGCL-SIGIR22

本文探讨了知识图谱及对比学习的相关理论,并旨在帮助读者更好地理解这些技术及其在推荐系统上的应用。随后将详细阐述论文的核心原理。

先导

知识图谱:

知识图谱(Knowledge Graph)是一种用以组织与表达实体之间的关联关系的图形化数据架构,在人工智能领域具有重要地位。它通过节点与边的形式来构建这样的联系网络,并特别关注如何有效整合散乱的知识资源以便于机器理解和应用这些信息

核心概念

实体(Entity)

  • 实体作为知识图谱的核心元素,在现实世界中代表物体实例。例如一个人可以代表具体的一个身体存在;一个地点则象征特定的位置空间;一本书则对应某个具体版本的文字资料等。 2.

关系(Relation)

关联用于说明实体之间的连接。例如,在历史学科中,“唐朝”的重要人物有李白这样的诗人代表,“法国”的重要城市有巴黎这样的首都代表。具体来说,“唐朝”的诗人李白是唐代著名诗人之一,“法国”的首都巴黎被称为世界文化之都。

属性(Attribute)

属性体现了实体的特征与特性。举个例子来说,一个人可能会拥有"名字"和"年龄"等属性。同样地,在一个城市中也可以观察到"人口"和"面积"这样的属性存在。

三元组(Triplet)

三元组构成知识图谱的基础单元,在其结构中通常表示为(实体1、关系、实体2)。例如,在这一模式下,“李白属于诗人”与“巴黎位于法国”均可被表示出来。

知识图谱在推荐系统中的作用

知识图谱通过构建多维度的语义关联、深入刻画实体间的关联性以及完善语义网络模型,在应对上述挑战方面展现出了显著提升能力。它在推荐系统中的应用重点主要体现在以下几个关键方面:首先在于实现精准化推荐体验;其次在于采用基于用户行为的知识图谱协同方法;再次在于借助内容特征辅助的信息传播;最后在于强化社会传播能力。

1. 丰富的数据表示

知识图谱采用图表形式将用户,项目及其属性,以及关系展示出来。\n例如,在电影推荐系统中,一个电影可以关联到导演这一角色以及演员这一角色,并涉及类型和上映时间等多个属性。\n在实际应用中,用户可以通过他们的兴趣爱好以及职业背景等特征来进行信息表达。\n

2. 深度语义关联挖掘

基于知识图谱的方法能够深入挖掘语义关联

3. 改善冷启动问题

对于新用户或新项目而言,在缺乏大量交互数据的情况下,在知识图谱的支持下仍可实现有效的个性化推荐机制

4. 提供可解释性推荐

知识图谱具备呈现推荐结果解释的能力。例如,在某些情况下(如系统可能向用户推荐了一部电影),它可以通过知识图谱来解释为什么这一选择被做出:A(喜欢的演员)在这部电影中有出演角色X;或者因为该影片与您偏好的另一部电影Y在主题上具有相似之处。

5. 多样化推荐

知识图谱有助于促进系统生成更丰富多样的推荐结果。借助对知识图谱中不同路径的挖掘,系统能够提供与用户兴趣相关但非直接关联的信息,从而防止推荐内容单一化及重复性。

对比学习

1. 对比学习的核心思想

对比学习的主要目的是将相似的样本(正样本对)使其趋近于彼此的位置,并使不相似的样本(负样本对)远离彼此的位置。这些样本对通常是基于一些预定义的规则构建出来的。

  • 正样本对 通常被称为同一图像或文本经过不同形式变换(如旋转、色调干扰等)后的实例或者属于同一类别下的其他样本。
    • 负样本对 属于不同类别或者相互之间没有关联的对象。

模型基于优化损失函数来实现这一目标。常见的对比损失函数包括Contrastive Loss(即Contrastive Loss),以及从信息论视角设计出的一种改进型方法(如InfoNCE)。

2. 对比学习的基本思想在推荐系统中的应用

对比学习的基本概念在于通过缩小相似样本间的距离并扩大不相似样本间的距离以实现有效的特征提取。在推荐系统中,这些'样本'包括用户、物品以及用户与物品的交互行为之外还包括用户的序列行为。

a. 用户与物品的表示学习

在推荐系统中,其核心目标是为用户与物品创建高精度的向量表示。对比学习基于正样本对与负样本对的构造,并能有效地提高这些向量表示的质量。

  • 正样本对 :常见于由用户与其喜好的物品组成的集合。
    • 负样本对 :常见于由用户与其未发生互动或不感兴趣的一系列物品组成。
b. 用户行为序列的对比学习

在推荐系统中,用户的互动轨迹(包括浏览、点击和购买等行为)通常能够一定程度上体现其兴趣演变特征。对比学习方法则通过分析不同时间段内的行为轨迹来提取用户的动态兴趣特征。

  • 正样本对 :可以在同一用户的相似时间范围内呈现的行为轨迹。
    • 负样本对 :可以在同一用户的不同时段或不同类型中呈现的行为轨迹。

这种新型技术有助于模型识别出用户兴趣的细微波动,并能显著提升推荐系统的个性化能力。

KGCL核心原理解释

该图表源自KGCL论文其核心组成部分主要包含四个关键模块:基于关系异质的知识聚合机制 针对知识图谱结构的增强策略 用户-项目交互图增强技术以及基于知识感知的协同对比学习方法。以下将逐一阐述这些核心原理及其具体实现细节。

Knowledge Fusion across Heterogeneous Relations

此处介绍的公式如下:

在消息聚合的一个子系统中,连接到xi和xe的三元组经过权重矩阵相乘,在经过激活函数处理后的Softmax权重下将各项相加,并与原始输入向量xi相加。

图中激活函数为LeakyReLU函数。

Augmentation on Knowledge Graph Structures(知识图谱结构增强)

基于原始知识表单gk, 我们采用随机强化策略生成两份独立的知识片段n1_g_k 和 n2_g_k, 在生成每个子表单时, 在其三元组上乘以权重因子mk₁ 和 mk₂ 来表示该知识是否被选中, 从而得到两份独立的知识片段;随后计算这两份独立的知识片段在消息融合后的余弦相似度;具有较高余弦相似性的片段被认为会对数据噪声产生较小的影响

Interaction Graph Augmentation(用户-项目交互图增强)

通过得到的知识图谱结构一致性数值ci,对其通过公式如下:

对知识图谱进行处理时,首先执行指数运算并对结果进行最大-最小归一化处理;随后对最小概率值进行截断处理;以均值作为度量指标来评估去掉用户节点与物品节点之间边的存在概率pui;通过公式6计算得到评估去掉用户节点与物品节点之间边的存在概率pui;接着去除影响较小的边;最终获得经过增强的知识图谱结构。

Knowledge-aware Co-Contrastive Learning(知识感知协同对比学习)

基于item语义及用户的交互行为模式来破坏图结构的过程中

这个方法于22年被提出,并具有较高的参考价值;主要阐述了其核心内容;其余内容较为简略;如需进一步了解可参考原文;本文仅旨在探讨其创新要点,并非官方发布内容;侵删

全部评论 (0)

还没有任何评论哟~