Advertisement

SOLO参赛,赛道二周冠军“达尔文”分享上分秘诀

阅读量:
图片

6月16日,2021腾讯广告算法大赛复赛已经正式拉开帷幕。本届赛事共有上千家高校和企事业单位的4335人报名。不仅如此,此次赛事还与计算机国际学术顶会ACM Multimedia强强联合。围绕视频广告开设的两大赛道,已成功入选2021年ACM MM grand challenge ,进一步提升了国际影响力。

与此同时大赛开展了竞赛论文征集活动 ,有意向的同学可以按照以下方式进行投稿

投稿方式

请将论文发送到大赛官方邮箱TSA-contest@tencent.com 开放提交时间

即日起至7月11日11:59 P.M. 论文要求
Multimedia grand challenge papers will go through a single-blind review process. Submitted papers (.pdf format) must use the ACM Article Template

https://www.acm.org/publications/proceedings-template as used by regular ACMMM submissions. Please limit each grand challenge paper submission to 4 pages with 1-2 extra pages for references only.

具体论文要求可以查看ACM官网
https://2021.acmmm.org/multimedia-grand-challenge-submissions
图片

为助力选手更好参与赛事,腾讯广告算法大赛特邀初赛赛道二周冠军“达尔文” 进行解题思路分享。

作者简介

大家好,我是赛道二初赛最后一周的周冠军“达尔文”,目前是模式识别与智能系统专业的应届毕业生,混迹数据竞赛圈两年左右,基本上都是孤军奋战。我参加其他竞赛前10拿过很多次,但这是第一次在腾讯广告算法大赛这么靠前,同时也很荣幸能够在这里分享一下比赛心得。

本人的主要研究方向是计算机视觉,这次比赛还是第一次接触到视频分类任务,在这里首先感谢主办方提供的数据以及计算资源,让我有这样一个学习的机会。下面是我对于赛道二的一些解题思路。

01 / 初赛初期

比赛的前两周主要集中注意力研究baseline ,跑通baseline时,成绩仅有0.735。后续仅能针对优化器、学习率、随机丢弃率做一些简单的修改,当时最大的上分点是使用RMSProp优化器会得到更好的结果,大致能达到0.768的成绩(目前学习率使用余弦退火策略时,RMSProp优化器效果平平,反而不如Adam优化器)。

02 / 初赛中期

之前主要是在keras的框架之下使用tensorflow,baseline基于原生的tensorflow进行代码的构建,难以根据自己的思路进行修改,因此基于paddle框架重新编写代码

这个阶段主要集中注意力研究模型的复现以及模态的选择 。模型的复现过程中需要注意激活函数、正则化、归一化方式的选择。对于本人构建的模型而言,除封面图片之外,所有模态都具有正向作用。

03 / 初赛后期

初赛后期调参已经没有明显变化,尝试的数据增强方法均被验证无效,开始寻求突破。突破点主要在于视频特征以及文本特征的表达 ,基于预训练模型重新抽取特征,其中重新抽取的视频特征对模型的精度提分最多(视频特征抽取建议使用vit,没换评分标准前0.795-0.803),已经稳稳进入前排。

初赛问鼎的关键之处在于模型融合 ,这里的模型融合仅使用多折交叉 ,大概能够提高七八个千分点,提升显著。

此外,在这个阶段还尝试使用ResNet3D抽取视频特征作为其中一个模态,但仅有万分之三的提高,并且严重影响速度,后续并没有继续使用。

04 / 总结

框架 :不同模态的局部特征经过Nextvlad整理成全局特征,然后拼接之后经过SE融合输出分类概率。

特征 :视频特征、文本特征均重新抽取,文本特征包括ocr、asr两部分

训练 :Adam+余弦退火有细微提升

随机丢弃率 :不同模态的dropout设置均大于0.9

分类 :直接使用一层全连接输出结果,多层反而效果会变差

05 / 后续思路

后续主要想从损失函数、数据增强、层级标签、端到端训练 几个方面入手,进行查漏补缺。目前已经进入瓶颈期,希望小伙伴们能够互相交流,多多上分。

最后,希望有大佬在以后的竞赛中,能够带带我,不想再孤军奋战了!!!
图片

由腾讯广告算法大赛官方主办的“技”高一筹系列专题直播现已开启。6月10日首场直 ,NVIDIA 亚太 AI 开发者技术解决方案经理王泽寰,以“Merlin:GPU加速的推荐系统框架 ”为主题,深度解析 NVIDIA 最新推荐系统解决方案 Merlin,共有3400余位技术同学收看了本次直播。

想要复习6月10日第一期直播内容及“视”界杯直播周内容的同学,可以通过官方公众号菜单栏,点击“2021赛事—直播回看 ”观看往期分享内容,也可以公众号回复“直播” 下载直播的相关PPT。

复赛期间,“技”高一筹专题直播仍将持续带来更多的算法干货,请各位选手收下这份直播预告 ,记得准时观看哦!

“技”高一筹专题直播预告

6月24日19:00 ,腾讯广告高级研发工程师—陈帆,将以"腾讯广告召回系统的演进 "为主题,讲解腾讯广告召回系统中广告-用户定向召回 / 基于双塔模型的ANN召回 / 基于复杂模型的DeepRetrieval的工程应用架构,及其如何支撑和服务当前的广告业务。

6月25日19:30 ,腾讯高级算法研究员—芦清林,将以“腾讯广告创意:智能创作引擎 ”为主题,讲解多媒体AI技术如何应用于广告创意的自动化&批量化生产,以及该项技术应用所带来的广告创作效率和广告投放效果的提升。

7月2日19:00 ,腾讯专家研究员—王红法,将以“多媒体AI技术在腾讯广告场景中的应用 ”为主题,为选手直播讲解如何借助于多媒体AI技术,更加有效地加深对广告创意、用户偏好等方面的精准理解,从而更好地服务于广告业务。

直播预约通道已经开启

抓紧预约吧!

全部评论 (0)

还没有任何评论哟~