CVPR 2020 论文大盘点-全景分割与视频目标分割篇

前文已介绍了图像分割在CVPR 2020中的占比率较高,并曾与大家分享了相关的分类内容。
CVPR 2020 论文综述——语义分割技术进展
今天的内容聚焦于全景分割(Panoptic segmentation)及其在视频目标分割中的应用(Video Object Segmentation, VOS)。
什么是全景分割?
全景分割即为同时完成背景语义分割与前景实例分割的任务。在图像分割领域中,这是一个新兴的趋势,请参考下图中的示例:

图片来自论文 Panoptic Segmentation,CVPR 2019
上图中,
(b) 语义分割的结果是赋予相同语义的实体相同的颜色,
(c) 实例分割是对目标前景进行逐个分析的逐像素标记,
(d) 全景分割综合考虑了语义分割与实例分割的信息。
该方法于CVPR 2019年首次提出然而自发布以来已引起广泛关注其中CVPR 2020年接收并发表了8篇相关论文
什么是视频目标分割?
将视频中的目标进行分割,在基于第一帧mask的方法中被称作one-shot VOS(单样本VOS),而无需第一帧mask的方法则被称为zero-shot VOS(无样本VOS)。具体相关内容可参考论文《Learning Video Object Segmentation From Unlabeled Videos》。
下图为实例级视频目标分割的例子:

图片来自论文 Video Object Segmentation with Re-identification,CVPR 2017
视频目标分割是一项整合检测、跟踪、分割以及ReID等多种技术的计算机视觉任务,在提供更为丰富的信息的同时也会面临较高的标注成本以及较大的计算规模。近年来随着高性能设备与相关数据集的不断涌现这一领域逐渐引起广泛关注。在CVPR 2020年会上共有8篇与此相关的文献发表
****全景分割
简单、快速、强大的用于自底向上全景分割的方法,语义分割分支使用D
eeplab
Panoptic-DeepLab: A minimalist baseline that is robust and efficient for bottom-up panoptic segmentation.
Contributors | B. Cheng, M.D.D.Collins,Y.Zhu,T.Liu,T.S.Huang,H.A.,L.-C.Chen
单位 | 伊利诺伊大学厄巴纳-香槟分校;谷歌
代码 | https://github.com/bowenc0221/panoptic-deeplab

使用双向聚合网络进行遮挡处理用于全景分割
[2] BANet 是一种结合双向聚合网络与遮挡处理的泛视图分割方法
Chen Yifeng, Lin Guangchen, Li Songyuan, Bourahla Omar, Wu Yiming, Wang Fangfang, Feng Junyi, Xu Mingliang, Li Xi
单位 | 浙江大学;郑州大学

利用密集检测结果的实时全景分割
[3].Real-Time Panoptic Segmentation From Dense Detections
RuiHou JieLi ArjunBhargava AllanRaventos VitorGuizilini ChaoFang JeromeLynch AdrienGaidon
单位 | 丰田研究所;密歇根大学

用于全景分割的双向图推理网络
[4].Bidirectional Graph Reasoning Network for Panoptic Segmentation
主要贡献者:杨新 Wu、张恒伟、高一明等
单位 | 中山大学;DarkMatter AI Research

像素共识投票用于全景分割
[5].Pixel Consensus Voting for Panoptic Segmentation
作者 | Haochen Wang, Ruotian Luo, Michael Maire, Greg Shakhnarovich
单位 | 卡内基·梅隆大学;TTI-Chicago;芝加哥大学
代码 | 即将

视频全景分割
[6].Video Panoptic Segmentation
作者 | Dahun Kim, Sanghyun Woo, Joon-Young Lee, In So Kweon
单位 | 韩国科学技术院;Adobe Research
代码 | https://github.com/mcahny/vps
备注 | CVPR 2020 Oral

学习实例遮挡用于全景分割
[7].Learning Instance Occlusion for Panoptic Segmentation
作者 | Justin Lazarow, Kwonjoon Lee, Kunyu Shi, Zhuowen Tu
单位 | 加利福尼亚大学圣迭戈分校

统一全景分割的训练和推理方法
[8].Unifying Training and Inference for Panoptic Segmentation
作者 | Qizhu Li, Xiaojuan Qi, Philip H.S. Torr
单位 | 牛津大学

****视频目标分割
一种视频目标分割的转换方法,采用标签传播的方式,简单高性能、高效率。
[9].A Transductive Approach for Video Object Segmentation
作者 | Yizhuo Zhang, Zhirong Wu, Houwen Peng, Stephen Lin
单位 | 微软亚洲研究院;卡内基梅隆大学
代码 | https://github.com/microsoft/transductive-vos.pytorch

学习快速与鲁棒的目标模型(表观模型与分割模型)用于视频目标分割
[10].Learning Fast and Robust Target Models for Video Object Segmentation
Mr. Andreas Robinson, Mr. Felix Jaremo Lawin, Mr. Martin Danelljan, Dr. Fahad Shahbaz Khan, Dr. Michael Felsberg
单位 | Linkoping University, Sweden;ETH Zurich, Switzerland;IIAI
代码 | https://github.com/andr345/frtm-vos

时序聚合网络与动态模板匹配的快速视频目标分割
Efficient Video Object Segmentation Technique Utilizes a Temporal Information Aggregation Network and a Dynamic Template Matching Algorithm.
作者 | Xuhua Huang, Jiarui Xu, Yu-Wing Tai, Chi-Keung Tang
单位 | 香港科技大学;腾讯
代码 | https://xuhuaking.github.io/Fast-VOS-DTTM-TAN/(即将)

从非标注视频中学习视频目标分割
[12].Learning Video Object Segmentation From Unlabeled Videos
研究团队成员 Xiankai Lu、Wenguan Wang、Jianbing Shen、Yu-Wing Tai、David J. Crandall 和 Steven C.H.Hoi 开发了这项研究
单位 | IIAI;苏黎世联邦理工学院;腾讯;印第安纳大学
代码 | https://github.com/carrierlxk/MuG

状态感知的跟踪器用于实时的视频目标分割
[13].State-Aware Tracker for Real-Time Video Object Segmentation
作者 | Xi Chen, Zuoxin Li, Ye Yuan, Gang Yu, Jianxin Shen, Donglian Qi
单位 | 浙江大学;旷视
代码 | https://github.com/XavierCHEN34/State-Aware-Tracker
解读 | 深入解析视频目标跟踪与分割技术的漫谈文章

交互式视频目标分割
[14]. Memory Fusion Networks: Highly Efficient Interactive 3D Video Object Segmentation
作者 | Jiaxu Miao, Yunchao Wei, Yi Yang
单位 | 百度;悉尼科技大学

基于文本的视频分割
[15].Visual-Textual Capsule Routing for Text-Based Video Segmentation
作者 | Bruce McIntosh, Kevin Duarte, Yogesh S Rawat, Mubarak Shah
单位 | 中佛罗里达大学;

快速模板匹配与更新,用于视频目标跟踪与分割
[16]. Efficient Pattern Matching with Continuous Updates in Video Object Tracking and Segmentation
作者 | Mingjie Sun, Jimin Xiao, Eng Gee Lim, Bingfeng Zhang, Yao Zhao
单位 | 西郊利物浦;利物浦大学;北京交通大学
代码 | https://github.com/insomnia94/FTMU(即将)

更多推荐:
本文系统性地探讨了当前人脸检测领域的前沿技术和研究热点,并对其关键技术进行了深入分析。研究者们提出了多种创新性的解决方案以提升检测算法的性能与鲁棒性。其中一项重要突破是提出了一种基于深度学习的面部检测算法,并将其与多任务学习框架相结合以优化模型性能。此外,在实际应用中发现将模型参数数量控制在合理范围内能够有效提升识别效率与准确率。针对不同场景下的实际需求还开发了多种自适应优化策略以进一步增强系统的泛化能力与实用性
深度学习领域顶级会议CVPR 2020年举办的论文综述性分析——聚焦目标追踪技术的研究进展
[CVPR 2020 文本图像论文综述]
该文系统梳理了CVPR 2020期间行人检测与重识别领域的最新研究成果与创新方法,并对相关工作进行了全面评述与深入分析

备注:分割

图像分割交流群
语义分割、实例分割、全景分割以及抠图等技术都是当前图像处理领域的重要方法;如若您的其他账号已属于CV君的朋友,请直接私信告知。
我爱计算机视觉
微信号 : aicvml
QQ群:805388940
微博/知乎:@我爱计算机视觉
投稿:amos@52cv.net
网站:www.52cv.net

在看,让更多人看到

