RKGE Recurrent Knowledge Graph Embedding for Effective Recommendation 论文
这篇论文提出了一种基于循环网络的知识图谱嵌入框架RKGE(Recurrent Knowledge Graph Embedding),用于提升推荐系统的性能。该方法通过自动挖掘实体对之间的路径,并利用循环网络对不同长度的路径进行建模和编码,从而学习实体和路径的语义表示。与现有方法相比,RKGE能够更灵活地捕获实体及其关系中的语义信息,并通过池化操作区分不同路径的重要性。实验结果表明,RKGE在推荐表现上优于其他知识图谱嵌入方法,并且能够提供更加具有解释性的推荐结果。该方法的核心创新在于结合了循环网络和池化操作的优势,在保持高效计算的同时提升了推荐系统的可解释性和准确性[1]。
[1] 以上内容为总结性表述,请以原文为准
基于循环知识图谱嵌入的有效推荐方法 [ Recurrent Knowledge Graph Embedding for Effective Recommendation ]
Abstract
关于KG应用于推荐,现行方法多依赖于KG的手工特征工程
本文引入了一种名为RKGE的新方法,在知识图谱嵌入领域取得了显著进展;该模型能够自主提取实体间路径的语义信息,并通过这种机制有效刻画用户的物品偏好意向。
该方法基于循环神经网络(Recurrent Neural Network, RNN)进行设计。在数据处理阶段,该系统通过批处理的方式对关联同一实体对之间的路径关系进行提取和建模,并将这些语义信息综合应用于推荐过程。
通过[pooling operator]这一技术手段,在区分不同路径时能够有效体现其重要性
RKGE在提升推荐性能的同时,在提供具有意义性的阐释性结果方面也表现出色。
KeyWords
KG、RNN、Semantic Representation、Attention Mechanism
Introduction
借用KG的辅助信息能够更好的进行推荐,而不是仅使用用户-物品交互。
现有方法:
基于知识图谱KG中的路径[meta path等]生成物品间的相似性,并将其应用到LFM模型中;主要依赖于人工特征工程与领域知识,并不足够全面。
随着表示学习领域的兴起[44][CKE],研究者们开始关注并采用知识图谱(Knowledge Graph, KG)嵌入作为推荐机制的基础。与前述方法相异的是,在这种框架下,每个实体及其属性通过基于一级自我中心网络(One-Level Ego Network, OLEN)的方式被赋予了其在知识图谱中的嵌入表示能力;然而其主要缺陷在于未能考虑通过知识图谱中路径连接的实体所蕴含的语义关联。
例子:

Bob对SPR的偏好推导:
1.Bob -评分- TT -分类为- DRAMA -分类- SPR
2.Bob -评分- TT -导演是- Steven Spielberg -导演- SPR
这些路径捕获了两种语义关系:1.属于统一类型 2.由统一导演执导
连接同一实体对的不同连接方式通常具有各自独特的意义;这些方式在刻画用户偏好时也展现出显著的差异性。
总结:
考虑使用循环网络[recurrent network] 学习实体关系中的语义;
循环网络擅长对不同长度的序列进行建模,并且特别适用于在知识图谱(KGs)中涉及不同数量实体的路径建模;此外,在这种架构下不仅可以通过专门设计的嵌入机制来捕捉实体语义信息(通过嵌入机制),还可以通过路径编码模块实现整体路径的信息提取与表示优化。
构建一个统一循环网络的知识图谱嵌入式模型 RKGE 用于实现数据处理
基于知识图谱(KG)的架构设计中,RKGE模型基于知识图谱(KG)的架构设计中,它基于知识图谱(KG)自主提取实体对之间的完整路径集合,随后通过多组循环单元组进行特征提取,每个路径通道由独立的循环单元建模.在批量处理过程中,各递归单元共享参数机制以防止模型过拟合.该模型架构通过多层递进式计算机制实现对不同长度实体关系的不同粒度特征学习和融合,从而实现对复杂关系推理能力的有效提升.
该方法通过池化操作分析不同路径对表征用户对项目的偏好行为影响的程度。
最后将推荐层与网络无缝集成,以通过端到端方式对RKGE进行训练。
该系统首次引入循环网络模型用于从知识图谱中提取实体及其关联路径的语义信息,并旨在实现精准的个性化推荐。
Related Work
Graph based Methods
[7] 在KG上应用扩散激活技术[spreading activation technique]。
该研究针对基于事件的社交网络中的推荐问题进行了深入探讨,并提出了一种创新性的解决方案;该研究将推荐任务转化为节点间的邻近性计算问题,并具体采用了马尔可夫链模型进行求解过程。
[2] 对KG进行逻辑推理[logic reasoning] 来推断用户偏好。
[3] RERA,采用个性化页面排名[Personalized Page Rank] 利用KG。
这些方法均建立在基础性的随机游走模型之上,在知识图谱组织形式的研究上取得了一定成果。然而,在现有研究中仍存在一定的局限性:即仅关注于知识图谱的组织形式,并未深入探讨实体间的语义关联及其相互作用机制。
Meta path based Methods
元路径[meta path] 严格规范地设置了路径的具体规则与固定长度,并用于提取知识图谱中的多维度语义信息。
利用元路径连接的物品之间的关系提升推荐:
该研究提出了一种基于元路径实体相似性的矩阵分解框架HeteMF;通过将用户的评分行为数据映射到用户-物品评价矩阵中,并对该矩阵进行分解;引入基于图正则化的约束机制,在元路径连接的相关物品间保持潜在向量间的合理距离。
该系统通过偏好传播机制帮助用户发现未被评标的新商品;这些新商品在知识图谱中基于异构关系分别与已评标商品建立联系。
通过元路径建模用户-用户或用户-物品的关系:
HeteCF 作为一种社交网络中的推荐系统,在其运行过程中主要利用元路径上的相似度信息来构建模型来刻画用户-物品、用户-用户以及物品-物品之间复杂的相互作用。
[28] SemRec 引入加权元路径概念
该矩阵分解方法通过计算基于元路径的相似度值对用户的用户关系网络进行正则化处理。
这些方法依赖于手工元路径的质量与数量,和领域知识的支撑。
KG embedding based Methods
基于TransR模型,在知识图谱(KG)中提取实体语义信息的基础上进行学习处理,并进而生成更为精准的物品潜在表示。然而在这一过程中,默认假设各路径之间相互独立,并未充分挖掘各路径之间存在的关联性;因此导致所构建的知识图谱难以全面反映真实世界的复杂性与多样性。
RKGE 基于循环网络对各种实体间路径的语义进行自动构建,并且同时利用池化机制来学习各个实体间的路径重要性。
Recurrent Knowledge Graph Embedding
RKGE首先通过自动化的方式提取实体对间的语义路径,并随后采用循环网络技术对这些路径进行转换和处理。该系统能够通过多批次的循环网络编码来处理不同长度和复杂度的语义路径特征,并进一步利用池化操作识别出各条路径的重要程度。最终所述的池化操作能够实现与推荐系统的无缝集成

Notations:

Semantic Path Mining
为充分利用知识图谱中实体间的关系网络,在提取不同语义路径的基础上构建完整的知识网络结构,并将其高效整合到循环神经网络的批处理机制中实现精准推荐。鉴于知识图谱中的实体数量庞大且路径繁多,在保证系统性能的前提下设计了两套优化方案:首先聚焦具有显著语义贡献的路径进行深度挖掘;其次在数据预处理阶段进行特征降维处理以降低模型复杂度。
1.仅仅考虑用户-物品路径 [user-to-item paths]
通过将用户的UI与其所有评分过的项目进行链接组合成一条链式结构。这种途径对于提升推荐效果至关重要,并且不仅包括相关的item-to-item以及user-to-user关系(作为基于user-to-item链路的延伸存在)。
2.枚举由长度约束的路径 [length constraint]
仅采用长度小于预设阈值的路径进行分析。通过较短路径可以更有效地捕捉实体间的直接关联关系;而过长的路径可能导致远端邻居的影响范围超出预期范围(remote neighbors),从而导致冗余信息和噪声干扰。
在上述两种创新性研究策略的基础上,在RKGE模型中能够实现对不同实体对之间潜在语义关系的有效识别。这些有效的关系模式会被循环神经网络批处理机制后续处理,并通过深度学习算法提取其语义特征表示形式以促进推荐效果的提升。
Recurrent Network Batch
将用户与物品之间的有向关系视为一个序列[sequence] ,其中序列的元素代表了这些关系中的具体实体。基于此观察,在处理这类序列时容易想到使用循环网络结构来处理其动态特征,并将其编码为可处理的形式...
鉴于不同长度的多个路径均可连接同一实体对,在设计一种新型网络架构时应充分考虑其潜在关系类型多样性。其中包含一组循环网络集合,在数据处理过程中每一独立循环网络负责学习单一路径的具体语义特征。
实体间的关系数目不断变化;与实体对的数量保持一致。各RNN模型共享统一参数集;有效防止了过拟合现象。
假定实体对(ui, vj)通过s个不同长度的不同路径(p_1, p_2, \dots, p_s)相连;值得注意的是s是一个动态变化的数量;对于任何一个长度为T的具体路径p_l而言,在这种情况下其形式可表示为p_l = e_0 \xrightarrow{r_1} e_1 \xrightarrow{r_2} e_2 \dots \xrightarrow{r_T} e_T, 其中规定起点与终点分别为e_0 = ui, e_T = vj.


该循环网络通过学习每个实体及其关联路径的语义特征来生成路径表示,在该模型中(RKGE架构),目标模块主要由两部分构成:首先是一个嵌入层[embedding layer]负责提取基本特征;其次是一个注意力门控隐藏层[attention-gated layer]用于强化关键信息。

Embedding Layer
在pl中取任意实体et,在其嵌入层生成对应的分布式表征plt。通过线性变换将其转换为低维向量空间。其中每个元素量化了实体与潜在主题之间的关联程度。最后能够有效提取实体语义特征。
例如一个路径pl的表示可以是

每个元素表示pl中对应实体的表示(嵌入)[representation (embedding) ]
这个新增的表示会被用来作为输入送到隐藏层,并用于编码整个路径的整体表示。
Attention-Gated Hidden Layer
在研究路径表示时,在深度学习模型中通常会遇到的问题之一就是如何有效地对不同节点进行建模。为此,在设计神经网络架构时需要综合考虑节点之间的关系以及它们在序列中的位置。具体而言,在这种情况下我们采用了以下方法:通过一种基于流模型的方法实现了对起始节点e0至终止节点eT这一序列信息的有效编码。
在时间步t−1时,在线编码一个隐藏状态hl(t−1), 该状态捕获了从e_0到e_{t−1}的信息序列;随后将其嵌入表示为\text{plt}, 并将其与当前的状态信息相结合. 从而生成下一个时间步的状态向量hlt.
最终的状态 hlT 将编码整个路径,因此可以认为是整个路径的表示。
使用一个注意力门控来更好的控制流经路径pl的信息:
令alt代表时间步t时的注意力机制[attention gate] ,它是一个介于0和1之间的标量值。在时间步t时,隐藏状态[hidden-state] 被建模为某种形式。

请关注门参数w_rntr的作用域特性,在协调前一层隐藏状态h(t-1)与当前候选隐藏状态h_t'的一致性方面发挥关键作用。在此过程中,当前候选状态通过融合计算当前时间步的输入信息来生成。

W和H分别代表前一步与当前步的线性变换系数,在此过程中引入了偏置参数b,并采用sigmoid激活函数进行非线性转换。
在最终阶段中,我们采用双向循环网络[bi-directional recurrent network]来推测注意门的位置,并最大限度地挖掘输入序列的最大潜力
我们基于当前时间步的输入观测以及来自两个方向的相邻观测数据来建立注意门模型:

两个hlt作为时间步t的上下文信息的总结:

综上所述,在注意力门控循环网络中对ui与vj的所有有效路径进行整合处理后会生成一个统一的循环网络批处理结构其中每一个注意力门控循环网络负责编码一条具体的路径信息
为了避免模型发生过拟合现象, 每个网络将遵循相同的参数设置. 最后我们获得了所有路径的隐藏表示, 并具体而言即为uj和vj之间的实体关系表示.
在后续阶段,在经过池化操作之后,在隐含的状态信息上进行分析,并观察其对实体间的关联模式具有显著影响。
Saliency Determination
在建模关系中或许各自扮演着独特的角色;而较短的路径或许具有更强的影响力。
我们开发了一种基于数据驱动的方法[data-driven] ,该方法通过池化机制来识别路径的关键性。该池化机制专注于提取各向量中最具代表性的特征 ,相较于attention机制更为适合这一场景。
在分析P(ui, vj)所涉及的s条路径时,在循环网络中得到各路径对应的最终隐藏状态分别为h₁^T₁, h₂^T₂,…, h_s^T_s ,其中Ts表示序列ps的最后一时刻同时也是其长度值。在此基础上进一步优化了算法性能以提升整体计算效率

该最大池化层[Max pooling layer] 用于提取全局最具代表性的特征。从而提取出综合后的隐层表示 h:

h[j] 表示 h 在第 j 维上的取值;为了防止 h 被特定的 hiTi 路径主导,在计算 P(ui, vj) 这一特定路径时(其中 ui 和 vj 分别代表输入向量 ui 和 vj),我们采用了平均池化操作[average pooling]来处理所有路径的最终时刻的状态信息
经过池化过程的处理后,我们获得了uj和vj之间所有路径的最终隐藏状态。这一结果也表明,在ui与vj之间的路径上所呈现出来的综合表现效果。随后,在完成池化层之后,我们引入了全连接结构[fully-connected structure]来进行后续特征的提取与融合。
量化ui和vj的关系(接近度[proximity]),rij:

当模型经过训练后即可利用RKGE对ui与vj之间的连接路径生成编码表示,并由此提升ui和vj的表现。在评估阶段时通过对ui与vk嵌入向量内积的计算来进行评估。
生成与之相关的评分。随后,在排序的基础上,选取评分为前k名的物品作为推荐结果。
Model Optimization
模型学习:
训练数据 Dtrain,例子:(ui,vj,rij,P(ui,vj)),损失函数为:

BCELoss即用于衡量真实值与预测值之间的差异[Binary Cross Entropy]。具体而言,则是将其建模为一个二分类任务
在循环层[recurrent layer]中采用BPTT技术实现时间反向传播,在其余部分完成常规反向传播过程以完成参数更新。
从每个用户的角度出发,系统会随机选取与其评分项目数量一致的未被评级的物品作为负面样本进行使用。

模型的可扩展性
该系统采用双层结构基于并行计算的方式进行优化设计。在每次训练迭代过程中, 所有用户的物品连接路径会在每一次迭代中同时被输入至RKGE模型中。此外, 在处理每个用户与物品之间的关系时, 双层RKGE机制能够有效地整合多条不同路径的信息来源。
的参数也会同时更新。
Experiments and Analysis
实验设置
Datasets
IM-1M由MovieLens 1M与IMDB组成,在电影名称和上映日期的基础上建立关联关系。为构建有效的数据集结构,在收集完所有IM-1M的数据反馈后将其按时间顺序排序后划分训练集与测试集两部分:其中前80%用于训练模型(training model),而后20%则用于测试模型评估(model evaluation)。
Yelp
评价指标
Precision@N (1,5,10) ;top-N MRR(Mean Reciprocal Rank) N=10 ;
实验结果
路径长度的影响

路径长度设置为 3 时结果更好;
池化方式的影响

平均池化比最大池化好
可解释性

推荐从不同方面、推荐有不同路径连接
结果对比

Conclusion
提出一种基于循环网络的知识图谱嵌入框架,RKGE
RKGE不仅能够建模不同类型实体的语义表示,还能够自然提取KG中实体的关系信息。
未来工作:考虑KG中实体类型的分类
References
更多参考文献参见原论文
Fuzheng Zhang and his co-authors presented a novel approach titled "Collaborative Knowledge Base Embedding for Recommender Systems" at the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (简称 KDD) in 2016. Their work was published in the conference proceedings, detailing innovative methods that significantly enhance recommendation systems through advanced embedding techniques.
This paper... at the 1st International Workshop on Machine Learning Methods for Recommender Systems in 2015 presents findings regarding knowledge graph-based recommendations.
Sneha Chaudhari, Amos Azaria, and Tom Mitchell (2017). A system built on the entity graph for recommendation purposes. AI Communications 30, 2 (2017), 141–149
Xiao Yu等作者在当年提出了协同过滤方法,在 heterogenous information networks 中引入了 entity similarity-based regularization.
Xiao Yu et al. conducted their research in 2013 on Recommendation in Heterogeneous information networks with Implicit user feedback within the proceedings of the 7th ACM RecSys Conference.
[33] Yizhou Sun, Jiawei Han, Xifeng Yan, Philip S Yu, and Tianyi Wu. 2011. Pathsim: Meta Path-based Top-k Similarity Search in Heterogeneous Information Networks. Proceedings of the VLDB Endowment 4, 11 (2011), 992–1003.
