文献阅读笔记(1)2018 CVPR - Competitive Collaboration
文章标题:
竞争性协作:一种联合无监督学习深度估计、相机运动分析、光流计算以及运动分割的方法
文章作者:
注
发表 :2018 CVPR
文章链接:
这里是一份资源分享,请您点击下方链接获取具体内容
1. 关键词:
Unsupervised Learning (无监督学习))、Generative Adversarial Networks (GANs))、Competitive Collaboration (竞争协作))、Low-level Vision Processing (低层次视觉处理))、Single View Depth Estimation (单目深度估计))、Camera Motion Analysis (相机运动分析))、Optical Flow Analysis (光流分析))、Static Scene Analysis and Moving Object Segmentation (静态场景分析与运动物体分割))、Automotive Autonomous Driving Technology
2. 目标:
基于对抗生成网络的技术,在未标注标注的自动驾驶场景下研究单目视频数据时
3. 研究价值:
视觉研究中存在大量密集且连续的信息数据,在这类标记信息中大多数都具有稀缺性且不易获取。本文重点探讨了以下四个核心问题:其一包括单目深度估计及其相关技术;其二涉及相机运动估计及其关键算法;其三则聚焦光流分析及其应用研究;最后对其分割方法及优化策略进行了深入探讨。
以往的相关研究曾尝试探索使用生成型输入数据的方法,然而这种合成数据与真实数据之间不可避免地存在显著差异
一些研究人员正在探索无监督学习以应对数据稀缺的问题;然而数据模糊性(即高度歧义性)构成了主要障碍。针对这一难题, 本研究提出了一种新的解决方案:通过整合这四个问题间的几何关系来更有效地降低数据模糊性。
已有研究曾尝试将两个问题整合为一个无监督学习框架。然而该方法效果并不令人满意。归因于在动态静态场景划分过程中未对人、车等关键物体进行专门划分。此外其假设与实际输入数据不完全一致。
4. 方法:
该文运用生成对抗网络(GANs)将四个子问题整合在一起进行训练;这四个子问题间将会实现相互促进;传统的GANs不同之处在于本研究采用了两个对抗者与一个协调者组成三人组对抗训练体系。
5. 结论:
本文引入了竞争性合作的无监督学习框架达到具体目的;
联合地训练四个问题良好地提升了各自的性能;
该研究首次基于基础视觉数据(单眼深度估计、 camera motion 和 optical flow)实现图像分割,在无监督学习框架下取得显著成果
相较于现有的无监督学习成果而言,在预测单目深度、相机运动以及光流等方面均取得了卓越的成果
