Next-item Recommendation with Sequential Hypergraphs 论文阅读笔记
论文标题:Next-item Recommendation with Sequential Hypergraphs
发表于:2020 SIGIR
作者:Jianling Wang,Kaize Ding,Liangjie Hong
摘要
虽然项目的内涵会随着时间推移而发生演变,但短期内可由用户的交互行为所定义的项目相关性仍然能够被系统提取,从而有效捕捉这种变化规律,并为揭示用户的动态偏好提供支持。
文章致力于构建一种基于顺序超图的下一项推荐框架。
(i) 基于超图模型来表示短期项目的相关性,并通过多层卷积网络来捕获超图中的多层次连接关系;
(ii) 引入残差门控机制来建模不同时间段之间的连接关系;
(iii) 设计融合模块用于整合动态化的项目嵌入与短期内用户的意图关联,最终将这些信息输入至自注意力机制中,实现对用户行为模式的动态化建模。
结论
- 研究现实世界场景中项目的动态特性,并构建了一个基于序列超图的后续项目推荐框架,在考虑短期项目相关性的同时实现了更高的准确性。
- 通过多层超图卷积网络结合残差连接机制以及融合模块的设计方案,使得模型能够更加精准地捕捉用户的偏好变化。
未来工作
- 跨平台或跨域传输动态模式以提高预测性能
介绍
-
在下一步推荐中实现了良好的成功目标,并旨在通过分析过去的行为模式来预测用户的下一次操作。
-
在特定时间段内为下一个项目推荐内容时, 文章认为项目的相关性可以通过用户互动定义的方式在短期内揭示出来.
-
为了捕捉到项目语义的变化, 文章建议在此类模型中采用超图 [1, 11] 来建模短期项目的相关性, 其中每个超边能够连接单个边上的多个节点.
-
然而, 虽然超图中的每个节点都代表一个具体项目, 但超边却能够将用户与之进行短暂交互的一组项目连接在一起.
-
在从项目相关性超图中提取具有显著表现力的项目语义时会遇到一定的挑战
-
超边编码下的项目相关性不再是单纯的成对关系而是扩展为三元、四元甚至更高阶的关系
-
项目的语义可以通过多层次传播机制实现扩散
* 比如说在(2019年9月)这张图中尽管不是由同一个用户购买iPhone 8却与Apple Lightning数据线之间存在两跳连接的相关性
* 因此为了有效学习表达性项目的语义需要开发出一种高效利用超图结构的方法
如何获取项目的动态意义
项目的语义会因时间和用户的改变而有所转变
在同一时间点上, 同一项目也可能带给不同的人不同的意义
因此, 在关注项目时需同时考虑其随时间和跨用户的变化变得尤为重要
-
本文从两个维度探讨项目的动态特性 ,以优化下一个项目推荐的价值
-
- 随着时代的变迁以及人与人之间的互动
-
- 充分发挥项目间的短暂关联性。
-
基于顺序超图构建一种新型的动态项目推荐系统框架。
-
为了分析不同时间段内的短期关联性, HyperRec 根据时间戳截断用户交互行为, 构建了一系列基于顺序超图的时间段内关联网络。
-
通过超图卷积网络 (HGCN), HyperRec 能够整合或聚合具有直接联系或高阶关系的相关项, 从而在每个时间段内生成相应的动态嵌入表示。
该框架有两个核心特色:一是通过一种专门设计的残差控制机制来处理来自过去的信息;二是采用了融合模块来编码每个交互过程中的关键特征,并包含动态项目的表示以及基于短期用户意图的行为建模。
其中一种融合模块主要负责将前后时间段的信息分别进行动态编码与静态提取,并将这些特征作为 HGCN 的输入信号传递至后续模块。
另一种融合模块则利用这种自适应的方式对各阶段的信息进行加权聚合,并将其输出结果作为最终表示的基础信息。
模型架构
HyperRec

- 通过不同时间段的项目相关性构建一系列超图后,HGCN能够有效捕捉多跳连接中的相关性。
- 前一时间段生成的动态项目嵌入,其残差门控层能够对未来的项目嵌入产生影响。
- 动态项目嵌入与短期用户意图被整合为统一的表现形式,用于表征动态用户建模中的每一次互动行为。

一个项目在某个时间段的重要性和关联性可以通过短期内用户的互动行为来体现,
并且项目的内涵会随着时代变迁以及用户关系的变化而不断演变。
这种动态变化有助于深入理解用户的偏好趋势。
例如:
iPhone 8 是在2017年发布时与其他几款最新设备(如Nintendo Switch等)一同被消费者选为首选产品。
到了2019年发布新的iPhone 11后,则iPhone 8 被认为是性价比高的替代选择。
同样地,在分析用户A购买的一束鲜花时,则可推断其主要用途是用于婚礼庆典。
实验
数据集
- Amazon :全球领先的在线电子商务平台。
- Etsy :数据集包含2006年11月至2018年12月期间最大电子商务网站之一的手工艺品销售购买记录。
- Goodreads:来自图书阅读社区的书籍数据库,在此平台上用户不仅可以标注书籍、评分书籍还可以分享自己的观点与书评。
数据预处理
- Amazon:整合了不同类别的购买数据而非单独按类别进行实验。我们通过评论时间戳来推断用户的购买时间点。剔除累计下单次数低于50的商品。筛选出在切割时间节点前至少参与过5次购物,并且在切割时间节点后仍保持2次以上购物记录的用户群体。
- Etsy:删除累计交易笔数不足50的产品。排除那些在2018年前累计仅有不到5笔交易或仅完成不到2笔交易的用户。
- Goodreads:筛选出在2017年前活跃度较高、与超过5本书互动过的读者群体,并保留那些在2017年内至少与其他书籍互动过两次以上的读者。
baseline
- PopRec:受欢迎度优先推荐算法[13]。该算法通过计算物品的人气度对其进行排序,并将最热门的物品作为推荐结果。
- TransRec:基于翻译机制的推荐方法[14]。 TransRec 通过用户特定的操作序列对不同项目的转换关系进行建模。
- GRU4Rec+:带有Top-k增益优化的递归神经网络 [16]。该模型是对 GRU4Rec [17] 的一种改进版本,在序列建模方面进行了优化。
- TCN:一种用于下一项推荐的卷积生成网络模型[44]. 该模型在典型的 CNN 基础上进行了改进设计。
- HPMN:具有个性化记忆能力的 lifelong 序列建模方法 [25]. HPMN 通过分层周期性记忆网络实现对用户的多尺度行为模式捕捉与融合。
- HGN:基于分层门控架构的顺序化建模方法 [22]. 该方法采用特征门控模块与实例门控模块相结合的方式进行建模。
- SASRec:基于自注意力机制的顺序化推荐算法 [18]. SASRec 利用自注意力机制捕获用户的动态行为模式,并将其简化为静态嵌入形式。
- BERT4Rec:基于 Transformer 模型双层编码器表示顺序化推荐方法 [31]. 该模型通过双向自注意力机制从历史交互序列两端提取多维度上下文信息。
评估指标
* HIT@K
* NDCG@K
* MRR
