Advertisement

【论文阅读笔记】Deep Learning based Recommender System: A Survey and New Perspectives(1)

阅读量:

这篇综述文章发布于ACM Computing Surveys期刊上。主要深入探讨了深度学习在推荐系统中的实践应用。研究内容主要包括以下三个方向:

(1)系统利用深度学习方法对推荐算法进行评估,并进行分类分析;
(2)综述性地探讨了推荐领域中的先进技术和研究进展;
(3)深入探讨并分析了该领域中的挑战问题及未来发展方向。

1 推荐系统和深度学习概述

1.1 推荐系统

推荐系统模型主要分为三类:

  • Collaborative filtering algorithms typically learn from user-item interaction histories, incorporating explicit feedback such as ratings and implicit feedback like browsing history.
  • Content-based recommendation methods primarily extract and analyze auxiliary information such as text, images, and videos to make personalized suggestions.
  • Hybrid recommendation systems integrate multiple distinct recommendation strategies to build a comprehensive model.

1.2 深度学习

深度学习属于机器学习范畴之一。
普遍认为深度学习的关键在于构建多层次的数据表示体系。
在应用层面而言,深度学习指的是基于神经网络模型通过梯度下降算法(包括但不限于SGD及其变种)对可微的目标函数进行优化的过程。
常用的网络架构类型包括:

多层感知器MLP等技术中包含自编码架构AE、卷积神经网络结构CNN、循环神经网络模型RNN、受限玻尔兹曼机模型RBM、神经自回归分布估计技术NADE以及对抗式网络架构Adversarial Network等基础模块。此外还包括注意力机制模型Attentional Models与深度强化学习方法DRL等核心算法。

1.3 深度神经网络用于推荐的原因

DNN在推荐系统中的应用与具体的任务,领域和推荐场景密切相关。神经网络结构具有end-to-end端到端可微的特性,并且能够针对输入数据的类型提供合适的inductive biases(归纳偏置,即一种关于学习算法目标函数的假设,可参考链接)。深度神经网络有多个模块复合成一个高复杂度可微分函数,支持端到端训练。这一特性在基于内容推荐的场景下有明显优势。对于user和item之间交互的多模态数据(例如图像、语音等)而言,传统方法针对特定模态数据设计特征导致推荐系统无法进行端到端训练,深度神经网络能够利用一种集成式结构对图像、文字和交互关系进行表示,颠覆性地解决了这一问题。此外,在高复杂度或者训练数据量非常大的场景下,使用深度神经网络可以获得良好的性能。传统的推荐算法如BPR,MF,CML在user与item交互数据上使用基于动量的梯度下降算法也取得了不错的效果。由于一些传统模型利用了Adam,Dropout或者Batch Normalization等深度学习中的高级方法,能够利用tensorflow等框架在gpu的支持下高效训练,实际上也可以将其看作是神经网络或者可微分结构。

DNN在推荐系统中实际应用时应注意的四个重要因素:

  • 非线性变换

大部分传统模型采用线性架构,在数据表示能力方面受到了极大的制约。相比之下, 具有合理架构的深度神经网络不仅具备无限逼近任意函数的能力, 并且能够识别用户与物品之间的复杂互动关系, 在精准捕捉用户偏好的方面表现出色

  • 表示学习

DNN能够在输入数据中快速提取潜在可解释性的内在特征,并实现有效的信息表达(称为数据表征)。通过从原始数据中自主提取特征这一机制减少传统方法的手工设计工作量。同时应用使得推荐模型能够整合多种类型的数据如图像、文本、音频和视频。在多源异构数据的学习过程中展现出巨大的潜力。

  • 序列建模

在推荐系统的模型架构中, 建模处理序列信号有助于解析用户行为模式以及物品演变规律. 深度神经网络(DNN)特别适合处理这类序列建模任务, 目前该方法已在多个领域取得显著成效

  • 灵活性

深度学习技术在各个领域的实践具有高度的灵活性。
目前,在人工智能领域中已经出现了tensorflow、pytorch和caffe等开源深度学习框架。
这些框架采用模块化开发的方式,并拥有活跃的开发者社群以及专业的技术支持体系。
它们显著提升了深度学习项目的开发效率以及实际应用中的性能水平。

1.4 潜在的限制因素

  • 可解释性

尽管深度学习在应用中取得了显著成效(显著成效),但在理论上仍面临诸多挑战,在许多实际应用中被视为黑箱处理(被视为黑箱处理)。随着相关理论研究的深入发展(深入发展),研究人员对隐藏层权重与激活函数参数展开了更为系统性的理论分析与合理解释(进行了更为系统性的理论分析与合理解释)。然而,在单个神经元的行为机制仍缺乏系统性的深入解读(缺乏系统性的深入解读)。目前最优模型已实现了某种程度上的局部可解性(某种程度上的局部可解性),并在此基础上指导下的推荐性能得到了部分提升(指导下的推荐性能得到了部分提升)。

  • 数据样本的要求

深度学习是一种基于数据驱动的技术,在拟合网络结构中的大量参数时需要收集海量训练数据。相比之下,在CV或NLP等领域由于标注数据稀缺性问题较为突出的情况下,在推荐系统中获取符合要求的海量训练数据则相对容易得多。从工业界到学术界拥有的百亿到十亿级别规模的数据集都非常常见

  • 大量超参数需要调节

超参数调节在一定程度上并非专属于深度学习领域的问题,在传统机器学习算法中同样也并非仅限于此。然而,在某些特定情况下,深度学习模型明显增加了额外的超参数数量。

全部评论 (0)

还没有任何评论哟~