Advertisement

【论文阅读第二期】The Wisdom of the few

阅读量:

论文阅读第二期的文章《The Wisdom of the few》讲的是基于专家观点的协同过滤推荐算法,是一篇2009年的文章。作者Xavier Amatriain是推荐系统领域的一位大牛,最早主导了Netflix的推荐系统,后来去了Quora,现在自己创办公司Curai研究AI。因为本人对推荐系统了解比较少,所以只是略读了文章,做一个简单的总结:1. 文章摘要;2.什么是协同过滤

1. 文章摘要

近邻协同过滤是一种有效的互联网用户推荐方法,但是传统的方法有几个明显的缺点:数据稀疏、噪声数据、冷启动等问题,Xavier Amatriain等人就提出了一种基于专家观点的协同过滤算法,用一个独立数据集中的专家评价代替传统的用户评分数据,专家观点的权重根据其与推荐用户的相似度来确定。经过在Netflix部分用户数据上的验证,该算法解决了传统算法的几个缺点,并且能取得相近的准确度,作者还专门设计获得了一个USER-STUDY数据集,对算法进行验证。

2. 协同过滤

什么是协同过滤?
协同过滤主要是基于相似性进行推荐,包括基于用户的推荐、基于物品的推荐、基于模型的推荐等

为什么文章作者说协同过滤是一种互联网用户有效的推荐方式?
在做互联网产品的时候有一个词叫“UGC”-用户产生内容,比如美团、淘宝这些平台上用户对商品及店家的评价,以及前段时间被扒皮说是用户评价数据造假的某旅游APP。用户的参与与输出能反映用户的偏好及习惯,基于此进行推荐,当然能有一定的效果。

协同过滤的难点
正如文章中所说,协同过滤推荐系统存在很多难点:
|- 数据稀疏性
|- 数据噪声
|- 冷启动
|- 相似度度量
|- 可扩展性

3. 木东居士分享:

  1. 推荐系统主要步骤:
    在这里插入图片描述

  2. “专家”数据该如何定义
    推荐系统应用范围广泛,那么怎么把“基于专家意见”的协同过滤方法应用到其他场景呢?关键的是“专家”数据如何定义。“专家”数据可以认为是“高质量数据”,比如音乐推荐中“专家数据”就可以是那些爱听歌和评论的活跃用户数据,他们的数据更新及时。

全部评论 (0)

还没有任何评论哟~