Personalized Bundle Recommendation in Online Games 阅读笔记
Personalized Bundle Recommendation in Online Games 阅读笔记
Deng Qilin、Wang Kai、Zhao Minghao、Zou Zhene、Wu Runze、Tao Jianrong、Fan Changjie 和 Chen Liang.
Netease Game 和 Sun Yat-Sen University
存在挑战
- 数据稀疏和冷启动问题。
- Bundle的泛化。
- Bundle与Bundle之间的相关性。
主要贡献
在工业界部署,通过在线A/B测试,提高了60%转化率和15%交易额。
该测试方法将用户群体划分为两个互不重叠的部分,并分别让他们采用两种不同的方案(A方案与B方案)。随后通过系统性地实施数据收集和处理流程,并深入分析和比较各项关键指标的数据表现情况,从而科学地得出结论以判断这两种方案在实际应用中的性能差异。
基于可区分的信息传递架构,在处理user-item、user-bundle以及bundle-item这三种关系时采取了不同的策略。
模型设计
整体是GCN-based模型。
基于传统的二元user-item图上构建了三元的user-item-bundle图
可区分的消息传递
该算法通过矩阵运算实现某种特定的计算过程,在每一步迭代中使用激活函数对加权和进行非线性转换
链路预测层
* 类似NGCF,融合不同层GCN的表示
\mathbf{h}_{u}是由\mathbf{h}_{u}^{1}与…与\mathbf{h}_{u}^{L}依次连接组成的一个向量。\quad \mathbf{h}_{i}是由\mathbf{h}_{i}^{1}与…与\mathbf{h}_{i}^{L}依次连接组成的一个向量。\quad \mathbf{h}_{b}是由\mathbf{h}_{b}^{1}与…与\mathbf{h}_{b}^{L}依次连接组成的一个向量。
通过两层人工神经网络模型生成评分预测
模型训练
该损失函数由三部分组成:原始损失项(即BPR损失)与一个用于防止过拟合的正则化项
multi-task learning
相当于L1是一种预训练
标签泄露问题
原因:
在传统GCN中,在处理A与B之间是否存在连接时(或:当分析A与B之间是否存在连接时),该模型依然继续运用了AB之间的相互传递信息。
就像,在没有先前提及A和B是否相识的情况下却促使他们开始交谈。然而,在这种情况下进行的谈话与他们相识之间存在高度相关的活动。这表明,在这种互动中所透露的信息实际上揭示了他们的相识情况。
解决方法:
训练中采用小批次的方法。
为了预测A与B之间的关系,在AB之间没有直接消息传递的情况下需要先去除A与B之间的对话渠道后再进行预测。
模型最终完成推理过程。
\hat{p}=\hat{p}_{u b}+\frac{1}{|b|} \sum_{i \in b} \hat{p}_{u i}
将用户的Bundle预测得分分为两部分:一是用户的Bundle预测得分本身(即\hat{p}_{u b}),二是用户在Bundle中的每个item上打分的平均值(即\frac{\sum_{i\in b}\widehat{\textbf p}}{|b|})。
实验部分
数据集
Steam,Youshu,Netease,Justice
对比方法
BPR, BundleBPR, DAM, GCN-Bi/Ti- /B_, BundleNet- /B_
评估指标
MRR,Recall,NDCG
实验结果

消融分析
作者主要对三种设计进行了分析
分别是
| 设计 | 解释 | 作用 |
|---|---|---|
| REL | Relational GCN,也就是可区分消息传递,对每种交互分别计算,再组合 | 跟具体数据集有关 |
| MTL | 多任务学习,同时学习用户对items和bundles的偏好 | 跟具体数据集有关 |
| MBT | 小批次训练,解决标签泄露问题 | 对网易云和逆水寒数据提升巨大,其他数据也有提升 |
一些感悟
之前阅读过的论文大多采用将单个物品的嵌入表示进行聚合以生成 bundle 的嵌入表示的方法;然而,在这篇论文中提到了一种通过整合评分的方法同样可行;需要注意的是,在进行评分整合时,请按照该论文的方法进行操作:即先将这些评分通过 sigmoid 函数统一映射到同一量纲上(通常在 0 到 1 之间),然后再进行综合评价处理。
新接触到一种MRR的指标度量方法,MRR只关注列表中的第一个相关元素。
猜想与paper中图一的GUI有关,图中GUI只会展示一个Bundle。

掌握了某种新颖的思想,在进行用户-物品交互分析时,在经过收敛计算后得到了一个结果,并将其用作预训练得到的嵌入模型,并用于后续用户的群体行为预测分析。
标签泄露问题对模型的有效学习有着较大影响。
该模型为实际线上业务带来了15%的显著成交额增长,并引发了推荐系统在产业界的高度关注。
