Advertisement

人工智能开发实战推荐算法应用解析

阅读量:

内容导读

  1. 个性化推荐思路
  2. 推荐算法分类
  3. 推荐效果评估

一、个性化推荐思路

推荐系统会向您呈现一个定制化的人工智能服务方案。其核心依据是以下事实认知:人们通常会倾向于钟爱那些与其喜好的物品相似的其他产品;或是由于他们兴趣相投,在社交圈中也容易形成相似的兴趣爱好;此外,不同类型的客户群体往往表现出鲜明的消费偏好和购物模式。

该系统致力于识别并遵循这一模式,并以预测您可能感兴趣的其他物品为目标而工作;通过这种方式主动向您推送那些可能会吸引您的内容;从而逐渐建立一种让用户逐渐依赖该系统并享受其良好服务体验的关系;最终有助于提升用户的忠诚度;个性化推荐的过程如图所示

该系统通过其内部的个性化推荐实现流程保护或隐含了用户的偏好信息。这些行为数据则使我们能够分析出用户与商品之间的关联。

在线购买一套教材后,《人工智能基础与应用》课程内容丰富且专业性强。我们可以推断出小李对这一领域有浓厚兴趣,并基于他的专业背景和兴趣爱好向他推荐一本《机器学习》书籍是恰当合理的。

虽然没有直接购买人工智能相关的书籍,我们却发现了张帅与小明在客户信息类别上相当接近的情况.因此,在了解了'相似的人往往拥有相同的兴趣'这一基本规律后,我们可以为张海推荐《人工智能基础与应用》这本书.

总体来说,在分析用户的各项行为数据时,
系统会基于用户的偏好特征(如用户的兴趣相似性、喜欢相同类别的产品或具有类似购买历史等)
应用特定的个性化模型以及相关的方法,
对样本数据进行筛选和过滤,
识别出潜在感兴趣的商品或内容,
最终按照预测结果依次向目标用户提供相关建议,
这就是个性化推荐系统的工作流程。

推荐系统的 核心功能 就是 匹配 用户与 信息 , 并 在 信息 处理方面 具有 过滤 功能 。 作为 一种 信息 过滤 系统 , 推荐 系统 的 核心 特性 主要 表现 在 主动 化 和 个 性化两大 核心优势上 。

目前,推荐系统已广泛应用于诸多领域如图所示。常见有:

  • 电商平台

  • 个性化视频网站

  • 音乐歌单

  • 社交网络

  • 新闻网站

冷启动:

在推荐系统中存在一个常见问题被称为"冷启动"现象。具体表现为当新用户注册或新的物品被加入库中时,在如何有效向这些新增用户推送合适内容以提升其满意度方面存在挑战。如何将这些新增的物品有效地推广出去,并将其精准地吸引到那些对它感兴趣的人身上是一个重要课题。

例如,在刚上线的一个网站上,由于用户与商品的内容都较为有限,而用户的购买行为数据又相对较少,因此基于购买行为实现个性化推荐存在较大的困难

针对这一问题而言,在线教育平台可采取以下措施:首先,在推荐机制中采用热门内容的形式;其次,在用户体验方面持续积累并分析用户的互动行为数据;最后,在算法模型中优化提升推荐内容的质量与精准度。

二、推荐算法分类

根据推荐系统的数据来源不同, 可以将其实现方式主要分为以下几种: 基于用户行为的数据驱动型推荐, 基于内容特征的知识图谱型信息过滤型推荐, 以及基于社交网络的社会化传播型交互引导型推荐等多种类型.

主流的推荐系统算法主要有:

(1)协同过滤推荐

(2)基于内容推荐

(3)关联规则推荐

1、协同过滤推荐

协同过滤算法是推荐领域中应用最为广泛的一种算法;这种算法无需提前获取用户的特征数据或物品的基本信息;它主要基于用户的浏览历史和交互记录来进行个性化推荐。

协同过滤算法主要包含以用户为中心的协同过滤(User-Based CF)、以物品为中心的协同过滤(Item-Based CF)、以及隐语义模型(Latent Factor Model)等作为一种重要的推荐算法技术。

  • 基于用户与物品之间的相互作用关系的数据处理技术——利用统计学手段对数据进行建模与分析的方法也被认为属于内存中的协作过滤法或邻域方法;
    • 隐语义型模型——运用机器学习相关技术通过对数据的学习获得模型进而利用该模型来进行预测与推荐而这种技术也被归类于基于模式的方法。

(1)基于用户的协同过滤(简称UserCF)

基于用户的协同过滤算法的基本思想在于:向用户提供与其兴趣领域相似的其他用户的商品推荐服务

在为用户提供个性化推荐服务时,在系统中首先识别出与用户A兴趣相契合的一组用户群体,并将其定义为集合U。接着,在将集合U中的每一个用户的偏好信息整合后,在此基础之上筛选出那些既被该群体关注但尚未被用户A了解的内容,并将这些内容传递给用户提供。整个算法的设计思路主要包括以下两个核心环节:

①计算用户之间的相似度,选取最相似的N个用户构成用户集合;

②找到集合中用户喜欢但目标用户没有用过的物品,推荐给用户。

协同过滤算法中涉及的相似度计算等同于对两个向量之间距离的计算,在这种情况下,两者之间的距离越接近则相似程度越高。

比如,在介绍例子时,“偏好(...)作为一个向量”可以改为“用户的偏好(...)被表示为一个特定的数值型特征向量”。接着,“两个向量间的距离就是用户之间的相似度。”这句话可以优化为“这些特定的数值型特征向量之间的距离则直接反映了用户间的相似程度。”最后,“相似度通常用...表示。”这句话可以调整为“计算这种相似程度最常用的方法是使用皮尔逊相关系数或余弦相似度。”

皮尔逊相关系数:

余弦向量相似度:

基于向量空间中两个向量之间的夹角所对应的余弦值来衡量两个个体间的差异程度。当该值接近1时,则表明两者的夹角趋近于零度(即0度),这意味著这两个向量具有较高的相似性(如图5.4所示),这种现象被称为'余弦相似性'(similarity based on cosine measure)。具体而言,在这种情况下我们称个体a与b之间的'cosine vector similarity' sim(a,b)等于cosθ

当两个向量之间的夹角θ等于零时,在公式sim(a, b) = 1下,则表明两者方向一致且相等。当两个向量之间的夹角θ等于90度时,在该公式中得到的结果是零,则说明两者的相似度为零。此时两者的相似性程度最低。如果两个向量之间的夹角θ等于180度,则在计算中得到sim(a, b) = -1的结果,则表明两者的关联性是最强的负相关关系。余弦向量相似度理论通过分析上述基本概念来构建衡量个体间相似程度的方法。

其中xi和yi分别代表用户a和用户b对物品i的评分。可以看出无论是采用皮尔逊相关系数还是余弦相似度来衡量用户的相似性前提条件都是用户的评分为非空。如果是一个新的类别中的新用户提供者其没有进行过任何购买记录那么我们无法通过评分向量计算其与现有用户的相似性这种情况在信息推荐系统中被称为冷启动问题

一种解决冷启动的方法是基于用户的个体属性(如兴趣爱好、职业角色、个人属性等)来进行分析与计算,并进而实现用户的协同推荐

以下是三个用户的购物记录情况表,请问您需要我们为您推荐与用户D相关的商品吗?

从表格中可以看出与用户D最为相似的是由{用户A, 用户C}构成的用户的集合U={\texttt{user A}, \texttt{user C}}。\ 因此可以推断出:如果{\texttt{用户提供信息关于}}他们偏好的商品类别,则{\texttt{另一名 提供者在提供类似信息时}}他们可能也会偏好的商品类别。\ 因此具体的推荐列表应包含以下两种商品:{\texttt{item 4 和 item 5}}。

(2)基于物品的协同过滤(简称ItemCF)

基于物品的协同过滤是目前应用领域极为广泛的一种推荐算法。该算法的核心理念在于:为用户提供与他们先前收藏或偏好的物品具有高度相似度的商品建议。值得注意的是,在协同过滤中所谓的"相似"并非仅从商品内容属性方面进行考量;而是建立在这样一个认知基础之上:若某一群用户的喜好偏好中存在共同点,则认为他们对某些特定商品具有相似的兴趣指向。这种假设表明:若多数偏好的商品A拥有较高的流行度,则相应地商品B也具有较高的流行度这一现象能够反映出商品A与商品B之间存在一定的相似性特征。

通过物品的协同过滤算法用于推荐结果的合理解释。例如,在电子商务网站中,“如果顾客购买了此商品,则通常也会购买相关商品...”

ItemCF的计算步骤和UserCF大致相同,算法步骤如下。

①计算物品之间的相似度;

基于目标用户u,识别出与该用户历史兴趣点相关的物品集合,并筛选出最相关的一组候选项目。

在计算物品相似度时,在假设N(i)代表喜欢物品i的用户集合以及N(j)代表喜欢物品j的用户集合的情况下,则可定义为

该公式用来表示物品i和j之间的相似度:即占总用户的一定比例的偏好者同样偏好j。

可以发现,在两个产品的相关程度较高时,并且一个顾客仅消费过产品i的情况下,则可以推断该顾客对产品j具有较高的兴趣倾向。

当物品j非常火爆时,在大多数用户都喜欢的情况下,则会使得所有物品与j之间的相似度都较高;因此有必要对计算公式进行相应的优化。

在获得物品相似度之后,我们可以基于以下公式来计算出用户u对感兴趣物品j的兴趣度(或评分)r(u, j)。

其中S(i)表示与第i个物品最相似的前N个 items, 而N(u)则是指用户u曾经关注过的 items collection, 其中i就是这个 collection 中的一个具体 item。simij则表示第i个 items 与第j个 items之间的相似度, 而rui则表示用户u对第i个 items的兴趣程度。

此公式旨在表明,在用户的兴趣历史中与之更为接近的物品就越可能被包含在用户的推荐列表中并获得较高的评分

比如用户A从某网站购买了人工智能基础与Python编程这两本书,请您运用ItemCF方法给他提供一些建议书籍的推荐

首先评估这两本著作与其他著作在内容上的相似程度,并分别确定与其最为接近的三部著作(此处仅选择前三个最为接近的作品),随后利用兴趣度计算公式评估用户A对每本著作的兴趣程度,并将结果按照兴趣度大小排列即可完成整个推荐流程

2、基于内容推荐

基于内容推荐的核心理念是向用户推送与其兴趣高度契合的物品集合,在这种模式下如果一个观众偏爱励志题材的电影作品,则系统将会直接为您呈现《阿甘正传》这一影片资源。这一流程充分考量了观众偏好的特点以及作品的内容要素,在这种情况下无需收集用户的浏览记录就可以有效解决新用户的注册初期困境

基于内容推荐的核心问题是围绕如何建立关于用户兴趣特性和物品特征的模型展开的。主要有向量空间模型、线性分类器以及线性回归等技术可用。

基于内容推荐的机制需要预先提供用户和物品的特征数据。例如电影推荐系统中,则需为用户提供包括感兴趣类型的电影类别、主要演员及导演等信息作为用户的特征描述。同时还需要为每部电影提取其内容属性(如类型)、主要演员及导演信息,并记录时长等属性作为电影的特征。这些预处理需求在实际应用场景中往往面临诸多挑战。尤其是涉及多媒体数据(如视频文件、音频片段以及图像文件)时,在预处理阶段难以准确分类和详细描述这些数据。且当数据量庞大的时候,在预处理阶段的工作效率会显著降低。

为了应对上述问题

基于内容的推荐算法如下。

①为每个物品(Item)构建一个物品的特征数据(Item Profile)

②为每个用户(User)构建一个用户的喜好特征(User Profile)

③通过计算出用户的偏好特征与商品特征之间的匹配程度...当两个用户的偏好相似程度较高时...当两个用户的偏好差异较大时...基于此判断原则...即可完成推荐

3、基于关联规则的推荐

关联规则通常用于电子购物平台中的个性化推荐系统。其核心原理在于分析物品间的关联性,并通过分析顾客的历史购买数据进行规则提取。这些分析能够识别出不同顾客群体间共同的商品购买模式,并进而帮助建立顾客兴趣模型并提供精准的商品推荐服务。

例如,在超市通道排队结账时随手 purchasing a pack of gum, one might also purchase several bottles of beer and a bag of chips in the same transaction. These seemingly impulsive purchases actually conceal particular shopping patterns.

早期阶段的关联分析主要应用于零售行业的购物模式分析,并因此也可被称为购物篮分析。

上表展示了用户的交易记录信息,在该事务数据集中被归类为用户的交易行为追踪系统展示平台。其中包含的面包、牛奶和啤酒属于单独的商品项目类别;而其他如香肠和葡萄酒则属于不同的商品分类范围;这些商品都具有明确的功能定位和使用场景特征,并通过系统内的积分兑换机制与会员权益体系相结合使用。

整个项目的集合被定义为总项集,在表格中列出的具体情况如下:下表中的总项集S={牛奶(位于第1行)、面包(位于第2行)、尿不湿(位于第3行)、啤酒(位于第4行)、鸡蛋(位于第5行)、可乐(位于第6行)};其中每一个单独的商品名称构成了一个1-项目集;商品名称的不同组合则形成了2-项目集以上的情况;例如,在表格中可以看到具体的商品名称及其对应的k值:{牛奶}是一个1-项目集;{牛奶, 面包}是一个2-项目集;{牛奶, 饿尿湿, 啤酒}是一个3-项目集。(其中k表示包含项目的数量)

评估一个关联规则是否具有吸引力,则需综合考虑以下三项关键指标:具体包括以下三项指标:支撑力度(Support)、信心程度(Confidence)以及提升效果(Lift)。

支持度(Support)衡量的是顾客在同一购物篮中同时购买两种商品的可能性大小。具体而言,它表示在总的销售记录数(N)中,商品组合A and B被同时选中的频率比例.这种指标通常用于评估商品间的关联性或协同购买行为,在数据挖掘和市场分析中具有重要的应用价值.
其具体计算公式如下:

\text{Support}(A \text{ and } B) = \frac{\text{同时购买A和B的记录数}}{\text{总记录数}}

(2)转化率指的是顾客购买A商品的同时也一起购买B商品的机会。当转化率较高时,则表明A商品的买家有显著的概率也会选择购买B商品;其计算公式如下:

上表显示,《尿布》与《啤酒》之间的关联规则支持度为3/4=0.75;相比之下,在《牛奶》与《面包》之间的关联规则支持度达到4/5=0.8。由此可知,在一次购物中如果顾客买了尿布,则有75%的概率也会买啤酒;而如果买了牛奶,则有80%的概率也会买面包。这些数据对于商场经营者的商品陈列与促销策略制定具有重要意义:例如,在推荐商品时可依据数据显示的商品关联性进行精准营销;或者将高关联性的商品组合在一起进行捆绑销售。

(3)提升效果取决于关联规则的有效性,在购买商品A的情况下, 另一个商品B的销售率会增加多少? 提升效果如何? 计算公式如下.

通常情况下,在计算商品间的提升度(A→B)时若其数值超过1,则表明商品A的销售量越高,则商品B的销售量也会相应增加。当提升度(A→B)正好等于1时,则表示这两种商品之间并无任何相关性或关联性。若计算得出的商品间提升度(A→B)低于1,则说明购买商品A的行为反而会抑制商品B的销售情况

关联规则的提取过程旨在识别所有满足以下条件的支持度(support)≥最小支持度(min_support)、置信度(confidence)≥最小置信度(min_confidence)以及提升值大于1(>1)的关联规则。例如,在购物篮分析中常见的{牛奶}→{面包}这样的模式通常被称为强关联规则(strong association rules),因为这些关联规则通常具有较高的支持度和置信度

可以通过遍历数据集合的各种排列组合来确定所需规则,在每一种情况下都需要判断其是否符合支持度和置信度的要求。对于包含有n个元素的数据集合而言,在计算所有可能情况所需的计算量与2的n次方成正比。

该算法遵循Apriori原则,在基础层次上设定支持度与置信度标准,并通过缩减规则数量来高效筛选出更具优势的强规则组合,从而实现更为精准的推荐效果

基于Apriori算法进行分析,并从下表所示的交易事务中挖掘潜在的关联规则。设定最小支持度为50%,同时设定最小置信度也为50%

应用Apriori算法的计算过程如下图所示:

通过上图的具体计算过程可以看出,在应用Apriori算法时会自然得出一个基础性质:即任何一个非高频项集所包含的大集合都不会是高频项集的状态(即其任一超集都不是高频项集),这极大地缩减了需要挖掘关联规则的空间范围;而所有被确认为高频3-项目组合的所有可能子组合同样满足高频条件(即各条规则均达到了至少50%的支持率),因此这些发现均可依据业务需求进行具体应用或进一步筛选备用方案

顾客的行为模式确实很有特色且值得关注。例如,在所有顾客群体中约有半数的人会同时采购面包、鸡蛋以及啤酒;如果有一位顾客选择了购买面包与鸡蛋,则必然会搭配着买上一壶啤酒。

基于这些经典的购买模式,在商店进行库存优化、推广促销策略以及优化商品陈列结构方面都提供了新的见解。

尽管推荐算法有很多种且都能为用户提供推荐服务,但它们各自在实际应用中的表现却大不相同。

  • UserCF系统能够在广泛的兴趣范围内有效地提供热门商品;然而其不足之处在于缺乏个性化的关注。
  • ItemCF算法则能在用户的个人兴趣领域挖掘出具有冷门性质的商品;然而却存在多样性不足的问题。
  • 基于内容的推荐系统主要依赖于用户的特征信息与商品特征;但也成功地解决了数据稀疏性及新用户体验不佳的问题。
  • 关联规则模型所呈现的推断结果易于被用户理解;然而,在面对小规模数据集时却并不十分有效;这可能会影响其应用效果。

因此,每种推荐方法都各有利弊,相辅相成。

三、推荐效果评估

在学习过程中我们了解到推荐系统不仅具有预测用户兴趣和行为的能力还能够挖掘出隐藏的兴趣爱好并给予用户的意外惊喜即为推荐系统提供实现这一目标的主要方法通常采用两种主要方法来实现这一目标

评分预测方法主要利用推荐算法采集用户的评分数据,并基于这些历史信息推测用户的潜在偏好。系统能够根据这种分析结果生成个性化建议内容,在线视频平台和音乐平台等领域都能见到这些技术方案的应用效果显著。

(2)TopN推荐通常不涉及评分因素,并旨在为用户提供一个具有个性化特性的推荐列表。该方法通过根据用户对物品感兴趣程度的预测来排序列表,并从中筛选出排名前N的物品进行推荐。这种技术在电子商务平台、社交网络应用以及互联网广告投放等多个领域均有应用。

为了全面评估一个推荐系统的性能优劣,在对推荐系统进行效果评估的过程中(即通过评价指标来衡量)的同时(即有助于发现该系统存在的问题),从而(即因此)有针对性地进行改进工作。那么如何具体量化和评价推荐系统的性能呢?

1、评估方法

常用推荐系统的评估方法有离线实验、用户调查和在线实验等。

(1)离线实验

为了使新推荐算法顺利上线,在开发团队的精心设计下必须经过多方面的评测验证才能正式投入使用。离线实验被视为当前应用中最为普遍的方法,在这一过程中我们主要依赖于用户的实际行为数据来进行评估。基于用户的实际行为数据能够直接评估新算法的各项性能指标,在开展离线实验时需要确保有足够的用户样本及其相关行为数据作为支撑。实现步骤如下。

  • 构建并整理测试数据集,并按照预设的比例将数据样本划分为训练集合与验证集合。
    • 基于训练集合建立算法模型,并对用户的兴趣点进行建模分析。
    • 根据设定好的评价标准,在验证集合上运行预测过程,并评估推荐性能。

(2)用户调查

该调查通常针对真实用户样本展开,在推荐系统的具体操作流程下生成准推荐结果进行对比分析,并最终用于评估系统性能。该方法存在的问题是人工工作量及存在无效数据误差的问题,在系统运行初期阶段由于缺乏足够的实验数据而面临挑战。

通过用户的问卷调查可以收集其感受信息,并且也可以与其展开交流互动。这种调研方式能够提供客观且详尽的理论指导效果。然而,由于操作流程繁杂且时间耗费较长会导致用户体验成本显著增加,并且规模庞大的用户体验调研工作难以顺利实施

(3)在线实验

在线实验中最常用的验证方法是A/B测试,在涉及大量用户的大型系统中,默认会根据一定规则将相似的用户提供到不同的实验组别中,默认会根据一定规则将相似用户提供到不同的实验组别中,默认会根据一定规则将相似用户提供到不同的实验组别中,默认会根据一定规则将相似用户提供到不同的实验组别中,默认会根据一定规则将相似用户提供到不同的实验组别中,默认会根据一定规则将相似用户提供到不同的实验组别中,默认会根据一定规则将相似用户提供到不同的实验组别中,默认会根据一定规则将相似用户提供到不同的实验组别中 getDefault getDefault getDefault getDefault getDefault getDefault getDefault getDefault getDefault getDefault getDefault getDefaultgetDefaultgetDefaultgetDefaultgetDefaultgetDefaultgetDefaultgetDefaultgetDefaultgetDefaultgetDefaultgetDefaultgetDefaultgetDefault.getDefault.getDefault.getDefault.getDefault.getDefault.getDefault.getDefault.getDefault.getDefault.getDefault.getDefault.getDefault/default/default/default/default/default/default/default/default/default/default/default/default/default/default/defaults/defaults/defaults/defaults/defaults/defaults/defaults/defaults/defaults/defaults defaults defaults defaults defaults defaults defaults defaults defaults defaults defaults defaults defaults defaults defaults default default default default default default default default default default default default默认在用户数量较大的大型系统中, 通常的做法是先按照一定的标准或规律对相近类型的用户提供到相应的对照组, 然后根据不同分组所对应的用户群体分别采用不同的推荐策略, 最后通过对各个对照指标的结果进行对比分析, 并评估各种推荐策略的效果表现.

这一方法的核心在于识别多个群体的相似性。若这些群体的一致性出现偏差,则对比分析的结果可能会有偏差。当部分用户的实际行为数据缺失时,在这种情况下对新功能进行验证测试的效果较为理想。然而,在实验过程中无法即时获取评估反馈,在这种情况下必须经过一定时间的实验周期后才能获得较为可靠的评估结果。

2、评测指标

推荐系统的效果评估主要包括定量分析定性评价 两种方法,在实践中发现 quantitative analysis 不仅能够通过 offline experiments 迅速得到结果,并且具有量化的特性而被广泛采用。其中常用的指标主要包括 user satisfaction, prediction accuracy, 和 coverage rate 等。

(1)用户满意度

用户满意度指标通常通过线上调研或实验测试的形式来收集数据,在实施调查时需要特别谨慎地设计调查表,并且对于调查结果的数据分析也提出了较高的要求。当采用用户问卷调查时,由于大多数用户的实际需求往往难以直接表达,可能导致较大的误差率。

通常采用网络实验法来评估用户的满意度水平。通过观察用户的后续互动行为是否具有关联性或影响力来判断推荐效果。在实际应用中常用点击率和转化率等指标来进行定量评估。

(2)预测准确度

通过离线实验计算出预测准确性(accuracy),该指标用于评估推荐系统的预测能力(performance),在推荐系统中被广泛采用作为核心评价标准(metric)。具体而言,则可分为基于评分的精准度(rating-based accuracy)与基于TopN的推荐策略(top-N recommendation)两大类。

该评分预测系统通常利用推荐算法分析用户的历史评分数据,并以此为基础推断出用户未给予打分项目的潜在评分值。以估算用户未给予打分项目的潜在评分为目标的应用场景主要集中在在线视频平台和音乐服务等场景中。其效果通常通过均方根误差(RMSE)和平均绝对误差(MAE)等关键指标来评估。

MAE因其计算简便而被广泛应用。尽管存在一定的局限性,在实际应用中需要注意其适用范围。其中对MAE指标影响较大的通常是难以准确预测的低分商品,在数学上可表示为:

在测试集T中包括了用户u和物品i,在其中rui代表用户u对物品i的真实评分,而ȓui则代表推荐系统提供的预测评分.可以看出,在MAE值方面越小意味着预测越准确.

然而有时候即使某推荐系统A的MAE值低于另一个推荐系统B 也有可能是因为推荐系统A在预测这部分测试集商品方面表现更为出色 显然在这种情况下采用这样的MAE指标并不恰当

而RMSE定义为:

RMSE提升了对那些预测错误的用户-物品评分实施了更为严厉的处罚措施, 因此评测标准因此变得更加严格.

TopN推荐一般会忽略评分信息,而是向用户提供一个经过过滤的个性化推荐列表。该系统通过分析用户对物品的兴趣程度来排序,并选取排名前N的物品进行展示与推荐。这种方法广泛应用于电子商务平台、社交网络服务以及互联网广告投放等领域。为了评估系统的性能表现,主要依据的是精确率(precision)和召回率(recall)这两个关键指标。

准确率即为所有用户在推荐列表中真正喜爱的商品数量与总商品数量之比。当该数值越大时,则表示用户倾向于更倾向于推荐的商品。计算公式如上所示。

Recall refers to the ratio of the total number of users who truly liked items in the recommendation list to the number of users in the test set who were interested in those items. The higher the Recall value, indicating that more recommended items appear in users' lists of liked items. This suggests that there are more recommended items that are popular among users.

由前面所述可知,在推荐性能方面, 准确率与召回率各自仅限于衡量一个方面; 最佳情况下, 则要求两者均较高.

更多精彩内容请持续关注本站!

全部评论 (0)

还没有任何评论哟~