【论文翻译|KDD2019】MEIRec:Metapath-guided Heterogeneous Graph Neural Network for Intent Recommendation
文章目录
-
摘要
-
1 引言
-
3 模型
-
- 3.2 统一项嵌入
- 3.3 基于元路径的异构图神经网络
-
结论
摘要
随着移动电子商务的广泛应用,在这种背景下出现了一种新型推荐服务系统——意向推荐(Intentional Recommendation),它被广泛应用于淘宝、亚马逊等移动电子商务平台中
1 引言
随着移动互联网的发展, 电子商务逐渐从个人电脑转向智能手机, 各类移动电商应用不断涌现出来. 推荐系统作为一种基础服务, 其显著优势在于能够根据用户的兴趣提供精准化的商品推荐. 过去两年间, 一种新型推荐服务——意向推荐——在多个电商平台如淘宝与亚马逊中出现. 当用户初次进入电商App时, 系统会基于用户的使用记录, 实时提供用户的搜索建议(以多词形式呈现). 在移动互联网时代, 意图识别盛行的原因诸多. 首先, 由于在移动设备上输入文字较为不便, 意图识别能够在无需手动输入的情况下节省用户体验时间, 提高活跃度与粘性. 其次, 用户可能缺乏明确的购物意图或难以表述自己的需求, 因此一个个性化的意图识别系统能够帮助他们找到真正所需的产品.
在意向推荐系统中,历史信息可被划分为两大类。其中一类是基于属性的数据 ,这类数据用于描述对象及其特性信息,例如常见的用户配置文件以及项目的基本属性设置等。另一类则是基于交互的数据 ,这类数据主要记录了用户与系统之间的互动行为及查询活动情况,在具体应用中通常会涉及如下几类典型交互记录:例如用户的点击行为(即Item)日志、用户的搜索(Query)日志以及查询结果(Item)的相关指导性文档等信息。
在本文中,我们将意图推荐定义为:无需用户提供查询输入,根据用户的使用行为进行个性化意图匹配 。在这里,在我们的应用场景中,其中意图被定义为由几个简单直接反映用户意图的单词或术语组成的查询项 。然而,与传统的基于关键词或语义分析的知识密集型搜索引擎[3,14,22]相比,(1)它基于用户的交互记录来生成相应的搜索项,而不是模仿以往类似的搜索情形。(2)它不需要用户提供部分搜索关键词作为起始点 。另外,与仅考虑位置-关键词关系的传统移动搜索算法[24]不同,(1)我们的意向推荐能够综合考虑多种类型对象之间的复杂互动关系,而不仅仅局限于基于位置信息来进行简单的关联分析。(2)不同于项目推荐中的原子化信息模型,我们的意向匹配机制允许搜索结果随时间动态变化并适应不同的场景需求
目前业界使用的意图推荐方法,如淘宝和亚马逊,通常提取手工制作的特征,然后将这些特征提供给分类器,如GBDT[7]和XGBoost[4]。这些方法在很大程度上依赖于领域知识,需要人工特征工程。它们只利用了用户和查询的属性和统计信息,没有充分利用对象之间丰富的交互信息。然而,交互信息在实际系统中非常丰富,这对于捕获用户意图非常关键。
**异构信息网络(HIN)**作为一种通用的信息建模方法,由多种类型的对象和链接组成,在许多数据挖掘任务中得到了广泛的应用[10,17,18]。在本文中,我们提出用一个HIN来建模意图推荐系统,通过HIN我们可以灵活地利用它丰富的交互信息。如图2(a)所示,显然,HIN清晰地展示了意图推荐中的对象(如用户、项目和查询)及其交互关系,如“用户点击项目”、“用户搜索查询”和“查询引导项目”。虽然已经提出了一些基于HIN的推荐方法[8,19,23],但它们主要是利用用户与物品之间的交互关系,利用基于元路径的特征,这使得它们很难处理意图推荐中的三重对象交互。
本文提出了基于元路径引导的意图推荐嵌入方法(MEIRec)
我们提出了一种具有重要性的意图推荐问题,在现有研究中该问题尚不为人们所重视。
基于图神经网络(GNN)的创新性模型MEIRec被提出。
在将意向推荐系统建模为异构信息网络(HIN)后,在此框架下MEIRec通过利用元路径引导的邻居关系有效地提取了HIN中的丰富交互信息。
此外,在嵌入机制的设计上实现了统一性的同时也显著降低了参数空间的规模。
在经过大规模真实数据离线实验对比中发现我们的MEIRec表现优于现有具有代表性的模型。
在线实验则在淘宝电子商务平台上展开并取得了显著效果。
3 模型
该模型MEIRec的核心理念在于设计一个异构图神经网络(GNN)以丰富用户的表示信息及检索结果的相关性表示空间,在意图推荐系统的知识图谱构建中利用预定义的知识图谱中的元路径来指导不同步长邻居的选择,并通过异构GNN机制整合各层节点之间的特征信息以获取用户的多维度表征信息及检索结果的相关性表征空间,在此过程中考虑到条目通常具有简短的内容特点及复杂的关系网络特性,在数据处理阶段将不同类型的对象转换为统一的对象表征形式从而减少参数规模并提高计算效率
3.2 统一项嵌入
在过去的基于神经网络的推荐系统中, 每个用户的ID或查询语句都需要一个独特的向量表示, 这一点是无法忽视的关键特性, 特别是在意图推荐的情境下, 涉及到数十亿个不同的用户ID和查询语句, 这样的规模计算起来会非常庞大, 但所涉及的具体领域术语数量相对有限, 因此 在面对如此庞大的数据量时 提出了一种新的思路: 仅学习领域相关的关键术语向量 而我们的方法仅关注于这些核心领域的相关词汇向量表示
通过在统一的词嵌入空间中获取查询与条目对应的词表示,并将这些表示进行联合优化以提升整体语义信息的质量。从而使得整体语义信息得以更全面地融合。这些嵌入反映了词典中各实体间的交互关系及其与查询的相关性。此外我们只需要学习小尺寸的术语嵌入(在我们的实验中它大约是28万个对象)
3.3 基于元路径的异构图神经网络
结论
在本文中深入探讨移动电子商务环境下提升用户活跃度与粘性的关键因素——意图推荐问题
总结
