Advertisement

ReCDR:Expanding Relationship for Cross Domain Recommendation

阅读量:

Expanding Relationship for Cross Domain Recommendation

CIKM-Kun Xu, Liang Chen, Zibin Zheng-2021(CCF B)

思路

跨域推荐通过将辅助域的知识转移到目标域来缓解数据稀疏的问题。但是大多数工作都集中在利用桥接用户,忽略特定于领域的用户。于是提出ReCDR基于关系扩展的跨域推荐以提高小重叠域的推荐准确率。
ReCDR首先把每个域的交互建模成一个图,即局部图 ;然后通过预训练的节点相似性扩展关系来形成局部图的共享网络,即增强图 ;在增强图上,ReCDR采用了层次化的注意力机制 ;最后将输出嵌入与局部特征相结合 ,以平衡双目标任务的结果。

解决问题

  1. 如何提高跨域推荐的准确率,减少重叠用户? :构建局部图,计算每对节点的嵌入相似性,连接高相似度节点得到增强图,应用Node2Vec的图嵌入方法。
  2. 如何为推荐任务生成更具代表性的节点嵌入? :采用异构图嵌入方法来捕获节点特征。加入层次化注意力机制学习异构图上的信息。
  3. 如何在不平衡域数据的情况下提高推荐准确率? :联合增强图和局部图一起学习,同时训练每个域的公共注意力网络和私有注意力网络,嵌入聚合以平衡特征并提高准确率。

ReCDR模型

问题定义

1.异构网络:G=(V,E),每个异构图还与一个节点类型映射函数μ1:V->A和边类型映射函数μ2:E->R相关,A和R是一组预定义的节点类型和边类型,具有约束条件:在这里插入图片描述
2.DTCDR:同时考虑两个域D A 和D B 的属性信息,包括显示反馈、隐式反馈和边信息,双目标跨域推荐的目标是同时提高两个域的推荐性能。
3.三元组<u,i,j>:其含义是用户u更喜欢项目I。
在这里插入图片描述

模型概况

整个模型分为图构造层、关系扩展层、嵌入层、特征融合层、排序推荐层。
1.图形构造层 :首先从用户的隐式反馈中收集用户和项目信息,并不断对其进行编码,以供进一步使用。这些输入数据通常分为三类:喜欢,不喜欢,未注意。使用这些信息构建两个域的异构图,具有正反馈的交互被表示为边。
2.关系扩展层 :构建一个跨域异构图,在这个图上扩展关系,思路是计算所有节点的相似度,在内部构造新的键。应用Node2Vec 在此图上生成预训练的节点嵌入,基于这些嵌入,通过连接具有较高相似性的节点来扩展跨域关系。
3.嵌入层 :使用分层注意力机制分别学习局部图和增强图的节点嵌入。其思想是利用邻居信息扩展节点特征和边特征,并分配不同的权重聚合。最后获得两个嵌入,一个是局部图上的,一个是增强图上的。
4.特征融合层 :将局部嵌入和增强嵌入串联在一起作为完整表示。
5.排序推荐层 :将用户和项目的内积表示预测,采用贝叶斯个性化排序生成排名表。

关系扩展层

第一步,采用Node2Vec来将节点集合在这里插入图片描述嵌入到预先训练的嵌入在这里插入图片描述中。
第二步,计算每对节点的生成概率:在这里插入图片描述。其中sim是归一化余弦相似函数,t(x,α)是阈值函数,当它的输入大于1,输出1,否则输出0.对于输出为1的对,构造新边,α是超参数,控制添加边的部分。
最终生成的是包含用户-用户相似关系项目-项目相似关系用户-项目交互关系 的增强图在这里插入图片描述

嵌入层

使用基于层次注意力机制的异构网络嵌入方法:它可以学习选择更具有代表性的邻居节点或边的特征,并给予更高的权重。其中第一层将聚合邻居节点和目标节点的边嵌入,第二层将它们聚合在一起。
节点聚合 :考虑具有m个邻居节点的目标节点v,表示为在这里插入图片描述,这些邻居节点的嵌入组合设置为在这里插入图片描述在这里插入图片描述。为了有效捕捉邻居的影响,利用注意力机制。对于目标节点,其相邻节点的重力系数为在这里插入图片描述,第一个W是d维的,第二个是d _d维的。将初始邻居节点嵌入×系数得到节点聚合层获得的表示:在这里插入图片描述 。但是不同节点的邻居数量不同,为了简化计算,将m作为训练过程中的一个超参数,这样可以限制具有极大数量的邻居的节点,同时增强边缘节点的信息。
边聚合 :对于目标节点v,用在这里插入图片描述表示在v的邻居中聚合所有连接类型是r的边,在这里插入图片描述。加入 边级注意力机制,与节点聚合类似,不同类型的边表示首先组合,然后赋予不同的权重。在这里插入图片描述其中第一个W是e维的,第二个是e_e维的。
最后将双层注意力机制与一下逐层传播规则结合到边聚合中:在这里插入图片描述,其中在这里插入图片描述
第二层聚合 :目的是将上方聚合后的节点嵌入和边嵌入进行组合,公式为在这里插入图片描述,其中W是n*d维的,其中的特殊运算符代表Hadamard乘积。

特征融合层

局部图的嵌入大小可以调整,在嵌入层最后获得两个嵌入,分别包含特定域信息和跨域信息的每个节点。
通过简单组合来获得融合特征后的嵌入在这里插入图片描述

目标与模型训练

我们的目标是在获得最终的融合嵌入之后维客户提供项目排名列表推荐。使用贝叶斯个性化排序 安排推荐项目。
为了生成用户u对项目i的评分,计算内积在这里插入图片描述,然后使用BPR损失来训练:在这里插入图片描述
【根据BPR理论,对于每个用户u,我们必须采样一个正项和几个负项】
对于上述BPR损失,D={<u,i,j>|<u,i>∈D+,<u,j>∈D-}表示训练三元组,其中D+是现有边的集合,D-是不存在的边的集合。后一项是正则化器,λ是正则化系数。

总结

选用数据集Amazon review dataset在这里插入图片描述
采用基于排名的评估方法,并遵循留一策略来分割训练集,验证集和测试集。
评分4-5的为正样本,对于每一个正样本,我们遵循共同的策略,即随机选择99个没有用户交互的项目作为负样本,对每个测试用户的100个项目进行排名。
选择的评估指标是命中率HR和归一化折现累积增益NDCG,选topN=5,HR简单衡量正样本包含在推荐列表中的分数:在这里插入图片描述,NDCG在推荐顺序中占重要地位:在这里插入图片描述
对比模型:BPRMF,NeuMF,CMF,CoNet,ATF
总之,ReCDR的推荐准确率提高,与单域、多域(重叠用户、非重叠用户)方法都进行了对比,验证其优秀的准确性,进行了消融实验,验证了关系扩展、嵌入、特征融合的必要性。

全部评论 (0)

还没有任何评论哟~