基于python的电影推荐系统论文_一种电影推荐系统的设计与实现
设计制作
数码世界 P
.118
一种电影推荐系统的设计与实现
张博 李昂松 尹琛 湖北大学
摘要
伴随着互联网的进步,在海量数据中获取自身所需信息的成本愈发高昂。然而由于用户对于自身真实需求存在的不确定性以及数据的相关性与个人的需求存在不一致
喜好的结果的需求,催生出了推荐系统。本文根据
600
个用户对
9000
部电影的
10000
项评价,通过对各大网站的电影评分系统和电影推
对于推荐系统的探讨而言,在采用基于物品的协同过滤技术以及奇异值分解法(SVD)的基础上构建了两个评分预测模型与一个推荐系统,并以实现个性化观影体验为目标。
推荐服务。
关键词
:协同过滤 SVD 推荐系统
1 问题背景与提出
随着网络的发展及移动端的普及,
越来越多的人们接触到了网络,
截至
2018
年
6
月,
我国网民人数已破
8
亿。
用户在海量的数据中想
要查找到所需信息越来越难,
推荐系统应运而生。
它通过分析用户的
历史行为
,
向用户推荐能够满足他们兴趣和需求的信息
,
建立平台
与用户之间的密切关系
, 提高用户的满意度。
本文现根据
600
个用户对
9000
部电影的
10000
项评价
,
包括电
影信息、
用户对电影的评分等数据,
建立数学模型解决以下问题:
(1)
建立数学模型,
实现电影推荐系统,
以便对用户进行电影推荐。
(2)
建立合理的指标体系评价你所建立的推荐系统。
2 模型的建立与求解
在求解前,
为
了
合理简化模型,
现做出假设:
(1)
每个用户的评分可以反映电影的优劣程度,
保证用户评分的
合理性;
(2)
用户的喜好在一定时间范围内是不变的,
此假设保证模型的
可信性;
1
问题一
1
简单数据分析
已有数据中包含评分电影年份和评分提交时间等信息,
本文从
评分的出现频数、
电影发行情况与时间的关系以及评论时间的关系入
手进行简单分析.
(1)
电影数量与时间的关系
利用
EXCEL
统计出自
1902
年开始到
2018
年每一年的电
影数
量,
并对统计结果做透视分析。
结果表明,
全球电影数量自
1973
年
(65
部)
开始增速加快,
数量增长趋势成指数型,
到
2002
年时达到最大
值,
为
324
部,
此后增速放缓且每年电影数量整体上有下降的态势但
仍旧能够保持每年
160
部及以上的电影数量。
(2)
电影评价与年份的关系
利用
EXCEL
软件,
统计出自
1970
年开始到
2018
年每一年的评
价数量,
并对统计结果做透视分析。
结果表明,
全球用户对电影的评
论数量由
1980
年
(879
条)
开始出现显著增加,
每年评论数量呈现指
数式增长,
这与上世纪八十年代开始互联网的普及与个人电脑
PC
进
入寻常百姓家中有很大的关系;
评论数量在
1995
年达到最大值
(6012
条)
,
此后开始急剧跌落。
结合两次分析的结果可以发现,
1994
年至
2015
年间电影数量相差不会很大。
但在这
21
年中,
1994
年到
2004
年间的电影评论数远高于其他年份,
说明在这
20
年间人们对电影的
关注度非常高,
且
1994~1995
年可以视为电影的鼎盛时期,
这与电影
的
“黄金年代”
的时间大致符合
