Advertisement

推荐系统遇上深度学习(八十九)-推荐系统中的反馈循环

阅读量:

该论文综述了反馈循环与偏见放大在推荐系统中的作用。可通过以下链接下载完整版本:https://arxiv.org/pdf/2007.13019.pdf

1、背景

该推荐算法基于用户的交互历史和物品特征数据展开分析,并被用于生成具有个性化特征的推荐内容;然而,在这些个性化推荐成果中仍存在一定程度的偏差度影响因素主要来源于两个关键维度。

输入数据存在一定的偏差,在推荐系统中会优先展示热门商品。这些畅销品占据了大量比例的数据资源(见下图),但与此同时冷门商品由于缺乏用户互动记录而导致难以被系统识别其潜在价值

该算法可能导致这种数据分布偏差的进一步加剧。具体而言,在这种情况下, 算法可能会更倾向于学习并传播与热门物品相关的信息, 进而持续性地将这些热门物品反复推荐, 并延伸到可能不那么感兴趣的用户群体中

随着时间的发展, 推荐系统倾向于将当前流行度较高的商品递送给用户. 系统会持续地收集这些用户的互动记录, 并将这些反馈信息与最新获取的数据一同纳入训练数据中. 这种做法导致了不均衡的数据分布逐渐加剧; 随后, 系统会基于整合后的数据重新训练模型, 并以此向用户提供新的商品建议. 这一过程不断重复, 最终会导致系统对热门商品的关注度持续增强. 我们将其称为反馈循环(feedback loop).

反馈机制的存在不仅会导致推荐结果过度集中于热门商品(...),还可能导致用户的偏好特征持续变化(...),从而使推荐系统越来越难准确把握住用户的真正喜好。

接下来,通过实验来进一步说明反馈循环所带来的推荐结果的变化情况。

2、实验分析

在此处,研究利用MovieLens 1M的数据集进行分析与讨论。在这一份数据中包含以下几项具体信息:首先进行了简明扼要的介绍。具体而言,在这一份数据中包含以下几部分:第一部分包含4331名男性用户、75万条评分记录;第二部分则包括1709名女性用户的24万条评分记录;此外还计算了整个数据集的整体密度约为4.468%,即约有该数量中的四分之五涉及评分信息的比例较高

此外, 该研究采用 UserKNN (user-based collaborative filtering) 和 BPR (bayesian personalized ranking) 这两种算法, 并结合基于热门项目的推荐方法进行实验

该研究通过实证分析揭示了系统中的正向反馈机制对结果的影响。左侧子图为衡量推荐列表中各物品受评情况的变化趋势;右侧子图则对比分析的是各物品在被推荐列表中出现频率的变化情况;结果显示随着迭代次数增加;最终结果显示,在迭代过程中推荐结果逐渐呈现出高度集中化的特点,并主要集中在少数几件具有较高影响力的产品上

文中指出通过持续的信息反馈机制更新用户的偏好表征这一过程导致推荐系统在捕捉真实的偏好方面的能力逐渐减弱

下图中右图展示了不同性别用户打分分布之间的差异程度,在迭代过程中可以看出这些分布逐渐趋于一致。

进一步地,在每一轮迭代过程中(iteration),左图展示了男性和女用户评分分布与整体原始评分分布之间的Kullback-Leibler (KL) 散度的变化情况(see Figure 1a)。观察到,在这一过程中(process),女性用户的评分分布与整体原始评分分布之间的KL 散度逐渐减小(decrease),而男性的则逐步增大(increase)。右图则详细比较了不同性别群体在每一轮迭代中其评分分布与自身初始评分分布之间的Kullback-Leibler (KL) 散度差异(see Figure 1b)。可以看出,在这一阶段(phase)中(stage),女性群体所呈现出来的KL 散度上升幅度明显大于男性群体;这主要是因为男性的群体规模较大,在整体中占据主导地位(majority)。因此可以说,在数据类别数量较少的情况下(condition),该类群组更容易受到反馈回环的影响(influence)

3、反馈循环的缓解

在推荐系统的演进过程中,数据采集与处理一直是研究者们的核心关注点。

或许有些同学会认为这是一个相对简单的系统仅需解决explore问题。但事实上推荐系统的运营不仅关乎技术层面还需兼顾商业价值因此单纯解决这个问题并非易事。
我们面临两个关键问题:一是如何衡量explore活动所带来的收益与成本;二是如何设计高效可行的explore策略。
为了在极短时间内取得实际效益同时确保能够有效评估每次探索的效果我们需要采取一系列针对性措施。
如果不采取这些措施而是试图绕过这些问题就不得不接受系统随之变化的事实。

到这里为止,本文进行了介绍.如果有兴趣的朋友可以通过查找原文来进行进一步的阅读和理解.

第88集:基于深度反馈网络的显式与隐式反馈充分利用

2020-08-01

[

(此处为响应示例)

结合推荐系统与深度学习(八十七)-阿里基于搜索的用户长期行为序列建模

2020-07-19

[

](http://mp.weixin.qq.com/s?__biz=MzI1MzY0MzE4Mg%3D%3D&chksm=e9d01e11dea797074b8821d8d22db6bf9111747d874075a8ad750808e8fe17ec3b85df87b13b&idx=1&mid=2247487184&scene=21&sn=7ca0756653bdb213de667370982251a8#wechat_redirect)

推荐系统与深度学习的结合(系列文章第86篇)——腾讯与微博联合推出GateNet模型:通过引入门机制优化点击率预测性能

二〇二〇年七月十一日

[

](http://mp.weixin.qq.com/s?__biz=MzI1MzY0MzE4Mg%3D%3D&chksm=e9d01e5ddea7974bb7e6142aab9800061565e1c5346233441d2f94c3e8da869b4449cf1669c4&idx=1&mid=2247487132&scene=21&sn=3da71d2ec9ca8221bece05321b4bbb4c#wechat_redirect)

推荐系统与深度学习结合,在阿里的研究中深入探讨了对长尾用户行为序列建模的研究

2020-06-14

[

该文章链接为微信公众号文章分享链接
,其中包含唯一标识信息
__biz=MzI1MzY0MzE4Mg%3D%3D
以及具体的微信文章分享参数
chksm=e9d01d50dea794464f9fe110f69fdcdd920fdbbe4f726e587f509ce6177840fe8e7ca29b88d3&idx=1&mid=2247486865&scene=21&sn=d5061dfee23286ff24b46579e58c19f3#wechat_redirect
。建议通过复制链接至微信查看完整内容。

全部评论 (0)

还没有任何评论哟~