Advertisement

整理某学术会议全部文章——以ACM international conference on Multimedia为例

阅读量:

近期有必要对与ACM国际多媒体会议相关的两篇论文进行系统梳理。旨在了解当前研究领域的前沿方向与热点问题。由于这是个人首次涉及的相关领域内容,在此过程中积累了宝贵的经验教训。便于以后在此领域开展后续研究工作积累宝贵经验,并对未来相关领域的深入探索形成参考依据。

首先需要了解下这个会议,从ccf推荐会议列表中查到:

由该会议出版的成果已收入ACM数据库系列中,在图书馆系统内访问ACM数据库时,请选择其中的论文集部分,在该论文集页面查找会议名称即可,在其后点击进入详细页面即可查看某年某次会议的具体信息。

2018年 ACM MM 会议总结

会议摘要部分中,在Source Material这一栏里可以下载会议手册;在Table of Contents这一栏里可以下载会议收录的所有文章;其中有个实用的小技巧是,在Publications部分使用Chrome浏览器时可以实时翻译当前网页内容,这与谷歌翻译的功能非常相似。

今年将15个相关领域划分为四个主要研究方向。其中理解方向涉及视觉感知技术及其应用开发;还包括多模态数据分析方法及其实现;此外还聚焦于深度学习在媒体处理中的具体应用方案。参与方向则聚焦于媒体中的情感和社会信号捕捉技术;还包括媒体搜索算法及其实现;同时关注社会媒体传播机制及其优化方案。体验方向涵盖了人机交互界面设计理论及其实现;还包括多元化艺术形式的创作实践;此外还涉及娱乐文化教育协作平台构建方案以及分布式环境下的协作能力提升策略。最后系统方向则聚焦于移动媒体平台开发技术;还包括基于云平台的媒体服务优化方案;同时关注分布式媒体系统的架构设计与实现方案,并结合虚拟现实技术和增强现实效果展示技术提升用户体验。

下面列举一些感兴趣的文章进行摘要学习:

Video-to-Video Translation with Global Temporal Consistency 具有全局时间一致性的视频到视频转换

abstract:Although image-to-image translation has been widely studied, the video-to-video translation is rarely mentioned. In this paper, we propose an unified video-to-video translation framework to accom- plish different tasks, like video super-resolution, video colouriza- tion, and video segmentation, etc. A consequent question within video-to-video translation lies in the flickering appearance along with the varying frames. To overcome this issue, a usual method is to incorporate the temporal loss between adjacent frames in the optimization, which is a kind of local frame-wise temporal con- sistency. We instead present a residual error based mechanism to ensure the video-level consistency of the same location in different frames (called (lobal temporal consistency). The global and local consistency are simultaneously integrated into our video-to-video framework to achieve more stable videos. Our method is based on the GAN framework, where we present a two-channel discrimina- tor. One channel is to encode the video RGB space, and another is to encode the residual error of the video as a whole to meet the global consistency. Extensive experiments conducted on different video- to-video translation tasks verify the effectiveness and flexibleness of the proposed method.

虽然图像到图像的翻译已被广泛研究,但很少提及视频到视频的翻译。在本文中,我们提出了一个统一的视频到视频转换框架,以完成不同的任务,如视频超分辨率,视频着色和视频分割等。视频到视频转换中的一个随之而来的问题在于在闪烁的外观和不同的帧。为了克服这个问题,通常的方法是在优化中结合相邻帧之间的时间损失,这是一种局部的逐帧时间一致性。相反,我们提出了一种基于残差的机制,以确保不同帧中相同位置的视频级一致性(称为(全局时间一致性)。全局和局部一致性同时集成到我们的视频到视频框架中,以实现更稳定视频。我们的方法基于GAN框架,我们提出了一个双通道判别器。一个通道是对视频RGB空间进行编码,另一个是对整个视频的残留错误进行编码以满足全局要求。在不同的视频到视频翻译任务上进行的大量实验验证了所提方法的有效性和灵活性。

2 .

Hierarchical Memory Modelling for Video Captioning 视频字幕的分层存储建模


2017年 ACM MM 会议总结

同样附上会议摘要:

今年共有22个相关领域被划分为五个研究主题(包括多媒体系统和中间件、多媒体传输和交付、多媒体远程呈现及虚拟/增强/混合现实、移动及可穿戴多媒体)以及体验主题(涉及感知多媒体、无处不在的多媒体、新颖的多媒体互动、社交、情感及情感多媒体、多媒体讲故事及策展、多媒体协作与公共空间)、理解主题(涵盖多媒体深度学习、多模式/多传感器分析及描述、以及 multimedia 和视觉)以及参与主题(包括 multimedia 艺术与娱乐文化、多媒体搜索与推荐系统技术等)。相较于去年,在研究方向上我们新增设了新兴主题(涵盖数据隐私意义及技术应用、数据采集方法创新以及数据科学在 multimedia 领域的应用等),旨在更好地反映当前 multimedia 研究领域的最新动态与发展趋势。

整理的资料在此: <>

2017年会议论文摘要录 + 2018年会议论文摘要录 + 汇编(共约400篇英文摘要与中英文文献综述按应用领域分类)

全部评论 (0)

还没有任何评论哟~