Advertisement

Personalized Bundle Recommendation in Online Games 阅读笔记

阅读量:

Personalized Bundle Recommendation in Online Games 阅读笔记

CIKM 2020 的链接

Deng Qilin、Wang Kai、Zhao Minghao、Zou Zhene、Wu Runze、Tao Jianrong、Fan Changjie 和 Chen Liang.

Netease Game 和 Sun Yat-Sen University

存在挑战

  1. 数据稀疏和冷启动问题。
  2. Bundle的泛化。
  3. Bundle与Bundle之间的相关性。

主要贡献

在工业界部署,通过在线A/B测试,提高了60%转化率和15%交易额。

该测试方法将用户群体划分为两个互不重叠的部分,并分别让他们采用两种不同的方案(A方案与B方案)。随后通过系统性地实施数据收集和处理流程,并深入分析和比较各项关键指标的数据表现情况,从而科学地得出结论以判断这两种方案在实际应用中的性能差异。

基于可区分的信息传递架构,在处理user-item、user-bundle以及bundle-item这三种关系时采取了不同的策略。

模型设计

整体是GCN-based模型。

基于传统的二元user-item图上构建了三元的user-item-bundle图

可区分的消息传递

该算法通过矩阵运算实现某种特定的计算过程,在每一步迭代中使用激活函数对加权和进行非线性转换

链路预测层

复制代码
 * 类似NGCF,融合不同层GCN的表示

\mathbf{h}_{u}是由\mathbf{h}_{u}^{1}与…与\mathbf{h}_{u}^{L}依次连接组成的一个向量。\quad \mathbf{h}_{i}是由\mathbf{h}_{i}^{1}与…与\mathbf{h}_{i}^{L}依次连接组成的一个向量。\quad \mathbf{h}_{b}是由\mathbf{h}_{b}^{1}与…与\mathbf{h}_{b}^{L}依次连接组成的一个向量。

通过两层人工神经网络模型生成评分预测

模型训练

该损失函数由三部分组成:原始损失项(即BPR损失)与一个用于防止过拟合的正则化项

multi-task learning

相当于L1是一种预训练

标签泄露问题

原因:

在传统GCN中,在处理A与B之间是否存在连接时(或:当分析A与B之间是否存在连接时),该模型依然继续运用了AB之间的相互传递信息。

就像,在没有先前提及A和B是否相识的情况下却促使他们开始交谈。然而,在这种情况下进行的谈话与他们相识之间存在高度相关的活动。这表明,在这种互动中所透露的信息实际上揭示了他们的相识情况。

解决方法:

训练中采用小批次的方法。

为了预测A与B之间的关系,在AB之间没有直接消息传递的情况下需要先去除A与B之间的对话渠道后再进行预测。

模型最终完成推理过程。
\hat{p}=\hat{p}_{u b}+\frac{1}{|b|} \sum_{i \in b} \hat{p}_{u i}
将用户的Bundle预测得分分为两部分:一是用户的Bundle预测得分本身(即\hat{p}_{u b}),二是用户在Bundle中的每个item上打分的平均值(即\frac{\sum_{i\in b}\widehat{\textbf p}}{|b|})。

实验部分

数据集

Steam,Youshu,Netease,Justice

对比方法

BPR, BundleBPR, DAM, GCN-Bi/Ti- /B_, BundleNet- /B_

评估指标

MRR,Recall,NDCG

实验结果

image-20201210165702994

消融分析

作者主要对三种设计进行了分析

分别是

设计 解释 作用
REL Relational GCN,也就是可区分消息传递,对每种交互分别计算,再组合 跟具体数据集有关
MTL 多任务学习,同时学习用户对items和bundles的偏好 跟具体数据集有关
MBT 小批次训练,解决标签泄露问题 对网易云和逆水寒数据提升巨大,其他数据也有提升

一些感悟

之前阅读过的论文大多采用将单个物品的嵌入表示进行聚合以生成 bundle 的嵌入表示的方法;然而,在这篇论文中提到了一种通过整合评分的方法同样可行;需要注意的是,在进行评分整合时,请按照该论文的方法进行操作:即先将这些评分通过 sigmoid 函数统一映射到同一量纲上(通常在 0 到 1 之间),然后再进行综合评价处理。

新接触到一种MRR的指标度量方法,MRR只关注列表中的第一个相关元素。

猜想与paper中图一的GUI有关,图中GUI只会展示一个Bundle。

image-20201210171335037

掌握了某种新颖的思想,在进行用户-物品交互分析时,在经过收敛计算后得到了一个结果,并将其用作预训练得到的嵌入模型,并用于后续用户的群体行为预测分析。

标签泄露问题对模型的有效学习有着较大影响。

该模型为实际线上业务带来了15%的显著成交额增长,并引发了推荐系统在产业界的高度关注。

全部评论 (0)

还没有任何评论哟~