Advertisement

2017年网易游戏数据挖掘/机器学习实习生笔试回忆

阅读量:

2017年网易游戏数据挖掘/机器学习实习生笔试回忆

笔试题回忆 7道简答+1道编程

基本情况已明确:

  1. 当设备处于正常状态时产品的合格概率;
  2. 当设备处于异常状态时产品的合格概率;
  3. 设备经过调校后处于正常工作的可能性。
    问题为:当产品不合格时判断设备是否经过调校的概率。

思路:这是一道涉及贝叶斯定理与全概率公式的概率问题。仅需运用相关公式即可解决这个问题。

有一枚密度分布不均的硬币,在其基础上设计出一种方法能够以相等的概率随机生成1至3之间的整数。

思路:

复制代码
1. 可以运用编码的方法,有1到3有三个整数,设置抛掷硬币三次,每次正面朝上为1,反面朝上为0; 则三次的结果 001表示1,010表示2,100表示3,等概率产生  

比较麻烦的方法: 实验若干次,估计得到正面朝上和反面朝上的概率,然后利用n重伯努利分布公式,计算P(X\le k) = \frac{1}{3}P(X \ge h) = \frac{1}{3}中的k和h,然后抛掷n次,正面朝上小于等于k产生1,大于k小于h产生2,大于等于h产生3.
有类似的题目,比如一个可以等概率随机产生1到m的random(),如何等概率随机产生1到n(n不等于m),也是采用编码的方式

  1. 简述贝叶斯公式,并且叙述朴素贝叶斯分类器的原理和步骤。

虽然是学习过的知识,但真让总结写出来的时候,想写好,并不是容易的事

具体来说,在这种推荐机制中,默认情况下会基于用户的个人特征(如性别、年龄以及偏好等因素)进行分析。已知某位观众观看了某个视频后,默认情况下会挑选出与该观众拥有相似特征的人群,并为此视频提供推荐。这种基于用户特征的推荐系统通常能够实现精准匹配的效果。然而,在某些特殊情况下,默认情况下可能无法覆盖所有潜在的相关性

这是一道推荐算法的题,是基于用户内容的推荐算法。

  1. 大意是: 有A抽奖活动和B抽奖活动,A活动可得到a碎片,B活动可以得到b碎片。 每个人可以独立反复的参加A活动和B活动,无次数限制,但不同人之间的碎片不能交换。 同一个人,5个a碎片可以换一个b碎片,50个a碎片加10个b碎片可以换一个节日礼物。 现在有活动当天统计的两张表格,t1是A活动的记录表,有三列:user_id,finished_time, num; 分别表示参加人的id, 完成的时间和得到的a碎片数。 t2是B活动的记录表,和t1类似。活动仅限节日当天有效。 请使用sql语言,得到活动当天产生的最多的节日礼物数。

这道题不仅考查了Sql语言的基础知识。

此外还涉及到求礼物最大化的算法。

使用这种方法在实际操作中相当费时费力。

  1. 针对基于用户的视频网站浏览记录数据的一道题目,请考生阐述该算法的设计思路,并详细说明实施步骤。同时需要完整展示核心算法的具体实现过程,并需要用伪代码形式完整展示核心算法的具体实现过程。

这道题比较长,题目很绕

现需从千万用户提供中筛选十万用于投放广告。 以便收集这些百万用户的观看数据(如观看内容、时长等),在此之前我们已对十万真实用户进行了测试验证。 请设计合适的方法用于筛选这十万用户参与广告投放,并阐述具体思路及实现方案。

这是基于协同滤波的推荐算法题。
我的思路是:

复制代码
1. 从已测试的10万用户中找出对该广告感兴趣的用户群;
2. 分析该用户群的视频观看信息,通过特征工程提取出合适的特征向量;
3. 提取1000万用户的特征向量,和感兴趣用户群的特征向量进行相关度度量。挑选出相关度排在前10万的用户群,向其推荐广告。

这个数字游戏是一个编程问题。排成一列站立着有n个人。每一次都随机挑选编号为奇数的位置上的人离开。当有人离开后,剩下的人会填补之前的空缺;当只剩下最后一个人时,整个过程完成;那么站在起始位置m上的那个人最终幸存的概率是多少呢?

反思和体会
  1. 网易游戏的笔试题一直以来都具有较高难度。无论是研发岗所需的四道编程题还是数据挖掘岗的七道简答题与一道编程题相结合的设计题目都需要应聘者具备扎实的基本功与编程能力。
  2. 对于申请数据挖掘/机器学习实习岗位的同学来说题目设计均来源于实际应用场景例如视频推荐广告投放等相关业务模块的具体运作流程建议大家平时应当注重对这些领域的广泛涉猎。
  3. 从考察重点来看该岗位对于贝叶斯估计推荐算法以及概率论这几个核心领域的考察比重较大同时还会涉及数据库语言中的SQL语句的应用。
  4. 在简答题与编程题的选择上考生只能选择其一因此在决定先做哪一类题目时需要格外谨慎。我倾向于先尝试解答简答题但当一个多分钟都无法找到合适方案时我立刻转移思路转而应对简答题从而避免耽误过多时间。
  5. 简答题可以通过在草稿纸上进行手写并拍照上传的方式来完成而对于那些需要推导计算的过程建议采用手写的方式提交因为使用键盘操作会感到十分不便。

全部评论 (0)

还没有任何评论哟~