Advertisement

论文笔记_SLAM_Visual SLAM and Structure from Motion in Dynamic Environments A Survey

阅读量:

目录

1 论文介绍

2 大纲

3 热点问题:评估相机 pose 和 重建环境的三维模型

3.1 计算机视觉社区: SfM

3.2 机器人研究社区: visual SLAM

3.3 Incremental SfM

3.4 dense or semidense map

4 动态环境中的SLAM

4.1 研究目标

4.2 解决方案

4.3 应用场景

4.4 近期研究

5 动态环境下视觉定位和三维重建

5.1 Pipeline

​5.2 文章讨论的方法描述结构

6 ROBUST VISUAL SLAM

6.1 Motion Segmentation

6.2 Localization and 3D Reconstruction

6.2.1 核心问题

6.2.2 基于特征的方法(Feature-Based Approaches)

6.2.3 基于深度学习的方法

7 讨论部分

7.1 Robust Visual SLAM

7.1.1 Motion Segmentation

7.1.2 Localization and 3D Reconstruction

7.2 Dynamic Object Segmentation and 3D Tracking

7.2.1 Dynamic Object Segmentation

7.2.2 3D Tracking of Dynamic Objects

7.3 Joint Motion Segmentation and Reconstruction

7.3.1 Factorization

8 发展趋势与总结

9 经典论文


1 论文介绍

来源:ACM Computing Surveys (2区)

2 大纲

  • 关键问题 * 实现视觉SLAM的核心技术*
  • 实现动态目标的分割与追踪*
  • 实现运动目标分割与重建*_
  • 各类方案的优势与不足*_
  • 基于概率分布估计或通过优化选择来确定_是否对所有图像进行特征测量的结果进行集成(feature measurements)
  • 基于滤波器的方法(如卡尔曼滤波器)*_
  • 束流校正方法(Bundle Adjustment, BA)*_

**3****热点问题:**评估相机 pose重建环境的三维模型

  • 通过从多幅图像中检测到的一组特征对应,进行评估和重建。

3.1 计算机视觉社区: SfM

  • 因子分解相关的方法:
    • Pierre Moulon, Pascal Monasse, and Renaud Marlet. 2013. 基于因子分解算法的多图像投影结构与运动估计方法. 在 IEEE 计算机视觉国际会议(IEEE Int. Conf. Comput. Vis.)上发表文章。
    • Carlo Tomasi and Takeo Kanade. 1992. 基于正交透视条件下的图像流形状与运动重建方法. 在国际计算机视觉杂志(Int. J. Comput. Vis., Vol. 9)上发表论文。
  • 旋转平均化相关的方法:
    • Venu Madhav Govindu. 2001. 基于双视图约束条件的运动估计方法.
    • Pierre Moulon, Pascal Monasse, and Renaud Marlet. 2013. 鲁棒、精确且可扩展的结构从运动方法.

3.2 机器人研究社区:visual SLAM

一些广泛应用的开放性系统:
Changchang Wu 在 2013 年提出了名为《基于线性时间增量结构运动的方法》的研究成果。
该研究成果发表于《国际三维视觉会议》的 proceedings 中。

3.3 Incremental SfM

  • 将计算机视觉领域与机器人研究领域的相关工作进行整合。
  • SfM(离线)与visual SLAM(在线)早期工作的主要目标及特性差异导致计算机视觉与机器人社区所发展的路径存在显著差异,并基本上相互独立。
  • 代表作品:
    • 视觉位姿估计
      • David Nistér, Oleg Naroditsky, 和 James Bergen. 2004. Visual odometry. 在IEEE计算机学会会议---计算机视觉与模式识别会议Proceedings中发表。
      • Andreas Geiger, Julius Ziegler, 和 Christoph Stiller. 2011. 基于实时立体重建的方法. 在IEEE智能车辆 symposiumProceedings中发表。
    • 实时结构从运动
      • Etienne Mouragnon, Maxime Lhuillier, Michel Dhome, Fabien Dekeyser, 和 Patrick Sayd. 2007. 实时结构从运动算法. 在英国皇家机器视觉会议Proceedings中发布。
      • Etienne Mouragnon等. 2006. 实时定位与三维重建方法. 在IEEE计算机学会会议---计算机视觉与模式识别会议Proceedings中发表。
    • PTAM
      • Georg Klein 和 David Murray. 2007. 并行跟踪与映射技术及其在小型AR环境中的应用. 在IEEE/ACM混合增强现实会议Proceedings中展示。
  • 对比分析:基于 bundle adjustment 的增量 SfM 方法较基于滤波的 visual SLAM 方法在计算精度上具有显著优势,在给定相同计算时间的情况下表现更为出色。

3.4 dense or semidense map

能够生成密集或半密集地图(a dense or semidense map)的解决方案 * KinectFusion*
* KinectFusion 是一种基于深度感知技术的创新方法,在实时三维重建领域取得了显著进展
* 该方法由以下研究者共同开发:Richard A. Newcombe、David Molyneaux、David Kim、Andrew J. Davison、Jamie Shotton、Steve Hodges、Andrew Fitzgibbon、Shahram Izadi、Otmar Hilliges、David Molyneaux(再次)、David Kim(再次)、Andrew J. Davison(再次)、Pushmeet Kohli、Jamie Shotton(再次)、Steve Hodges(再次)以及Andrew Fitzgibbon
* 研究成果发表于2011年IEEE国际混合增强现实会议Proceedings中,并详细讨论了KinectFusion在实时稠密表面建模与追踪方面的应用

  • LSD-SLAM
    • Jakob Engel, Thomas Sch, and Daniel Cremers. 2014. LSD-SLAM: Direct monocular visual odometry. In Eur. Conf. Comput. Vis. 834–849.
  • 产生原因:
    • 随着人们对地理环境需求日益增长
    • 受价于成本低廉的技术进步(如微软Kinect等深度摄像头的发展)

4 动态环境中的SLAM

4.1 研究目标

  • 提供鲁棒性的定位;
  • 扩展其检测、跟踪和重构动态对象形状的能力。

4.2 解决方案

  • SLAMMOT
  • 基于贝叶斯方法,并利用激光扫描仪进行移动物体的检测与追踪。
  • Chieh-Chih Wang and Chuck Thorpe. 2002. Simultaneous localization and mapping with detection and tracking of moving objects. In IEEE Int. Conf. Robot. Autom., Vol. 3. 2918–2924.
  • Chieh-Chih Wang, Charles Thorpe, Sebastian Thrun, M. Hebert, and H. Durrant-Whyte. 2007. Simultaneous localization, mapping and moving object tracking. Int. J. Rob. Res. 26, 9 (2007), 889–916.
  • MBSfM (Multibody Structure from Motion)
  • 基于多体因子分解的方法来实现独立运动物体的重建。
  • João Paulo Costeira and Takeo Kanade. 1998. A multibody factorization method for independently moving objects. In Int.J Comput Vis,\textbf{29(3)},159–179.
  • Terrance E.Toult and Lisa Gottesfeld Brown.\textbf{Factorization-based segmentation of motions}. In IEEE Work.Vis Motion.

4.3 应用场景

  • 障碍规避技术 [63]
    • Danping Zhou and Ping Tan. 2012. CoSLAM: Collaborative visual SLAM in dynamic environments. IEEE Trans. Pattern Anal. Mach. Intell. 35, 2 (2012), 354–366.
  • 人机交互技术 [51]
  • 人类行为跟踪与跟随技术 [183]
  • 路径规划算法研究 [19]
  • 多机器人协作系统研究 [46]
  • 多机器人协作环境构建方法研究 [28]
    • Danping Zhou and Ping Tan. 2012. CoSLAM: Collaborative visual SLAM in dynamic environments. IEEE Trans. Pattern Anal. Mach. Intell. 35, 2 (2012), 354–366.
  • 智能车路系统开发与应用研究 [102]
  • 智能车路系统开发与应用研究(无人驾驶汽车领域) [76,18]
  • 增强现实设备及应用研究(含手机端与可穿戴设备) [76,18]
  • 视障辅助导航系统开发与优化研究 [4,134]

4.4 近期研究

  • 基于视觉的一般性SLAM方法

  • Khalid Yousif、Alireza Bab-Hadiashar和Reza Hoseinnezhad于2015年发表的论文 titled Visual Odometry and Visual SLAM: Applications to Mobile Robotics 在《智能信息系统》第1卷第4期(共289至311页)中。

  • 调查了一般的视觉SLAM方法*

  • 包括常见的视觉测程(Visual Odometry, VO)以及基于视觉的数据融合方案*

  • 滤波器、无滤波器以及基于RGB-D的方法*

  • Younes等人(2016年)[180]对近期各种技术的具体应用策略进行了全面而深入的比较分析*

  • 专注于如何将环境建模为图结构*

5 动态环境下视觉定位和三维重建

5.1 Pipeline

5.2 文章讨论的方法描述结构

  • A. Robust Visual SLAM
    • 1. Motion Segmentation 运动分割(也称为运动目标检测)
      • 1. Background/Foreground Initialization
      • 2. Geometric Constraints
      • 3. Optical Flow
      • 4. Ego-Motion Constraints
      • 5. Deep Learning
    • 2.Localization and 3D Reconstruction * 1. Feature Based
      • 2. Deep Learning
  • B. Dynamic Object Segmentation and 3D Tracking
    • 1. Dynamic Object Segmentation 动态对象分割(也称为多体运动分割,将所有特征对应聚类成n个不同的对象运动)
      • 1. Statistical Model Selection
      • 2. Subspace Clustering
      • 3. Geometry
      • 4. Deep Learning
    • 2. 3D Tracking of Dynamic Objects
      • 1. Trajectory Triangulation
      • 2. Particle Filter
  • C. Joint Motion Segmentation and Reconstruction
    • 1. Factorization
      • 1. Multibody Structure from Motion (MBSfM)
      • 2. Nonrigid Structure from Motion (NRSfM)

6 ROBUST VISUAL SLAM

6.1 Motion Segmentation

  • 运动目标检测(亦称运动目标识别与分割[30,74,84])采用将图像中的特征划分为静态与动态两类的方法,并以实现对图像运动区域的识别。

6.2 Localization and 3D Reconstruction

6.2.1 核心问题

  • 相机姿态的评估以及基于多幅观测图像的三维重建
  • Standard visual SLAM
  • 基于 epipolar 几何原理,并整合所有特征对应关系进行求解。
  • robust visual SLAM
  • 主要依赖于通过运动分割算法提取出的静态特征进行求解;
  • 动态特征则被视为异常值,在计算过程中予以排除。

6.2.2 基于特征的方法(Feature-Based Approaches)

  • 一般步骤 * 1). 特征提取(feature extraction):进行 Visual Odometry[117],
    • 利用的检测器:
    • Harris [57]: 1988,较早的工作;
    • SIFT [99]:2004,近期工作;
    • SURF [8]:2008
    • FAST [130]:2006,为了实时性能[76, 94]。
    • 2). 确定图像点对应关系 (find correspondences)
      • 根据两个相机的光学中心(称为基线/视差)之间的距离,分成两类
    • short baselines
      • 采用 以光流为基础的技术(optical flow-based techniques)来进行匹配
        • 比如 KLT方法[100] (Kanade-Lucas-Tomashi (KLT) tracker)
    • long baselines
      • 采用 高区别性的特征描述符 之间的差异,来找 correspondences
        • 特征描述符比如:SIFT [99], SURF [8], BRIEF [17], BRISK [91]
      • 为提高鲁棒性,提出如下robust estimators,来排除异常值,和处理假的对应关系(false correspondences)
    • RANSAC [37] ;PROSAC [22];MLESAC [158]
    • 3). 评估计算相机的位姿(pose) * 利用极线约束
    • 8-point [53]
    • 5-point algorithm [116]
    • trifocal tensor [156]
    • 如果场景的某些3D点已经被重建(或已知),可采用PnP算法( perspective-n-pointproblems**)** * 例如 P3P algorithm [42]
      • 参考:三维重建笔记_相机标定(相机矩阵求解)基本概念汇: <>
    • 4). 重建场景3D点 * 对极几何约束:通过三角剖分法中,对应点的两条投影射线线相交的位置(intersection),计算出点的3D坐标。
    • 评估 the intersection
      • 中点法:midpoint method [9]
      • 最小平方法:least-square-based method [60]
      • 为避免漂移问题 drifting problem:
        • 采用 bundle adjustment (BA) 的方法,最小化 reprojection errors,来优化 camera pose 和 3D points。
      • 其他优化场景的结构和摄像机的motion的方法:
        • Levenberg-Marquardt (LM) optimization
          • 基于 Gauss-Newton method;
          • 较普遍常用的方法。
      • 参考:三维重建笔记_光束平差法:<>
  • 其他方法(variations) * LBA(local bundle adjustment)
    • 只优化最后几张图片,Mouragnon et al. [110, 111]
    • PTAM * pipeline在不同的线程上执行,实现跟踪和映射实时性;
      • 引入了选择关键帧的思想。
    • Lim et al. [94]
      • 使用二进制描述符,和度量拓扑映射(a metric topological mapping)
    • 目的:大规模映射可以实时进行,且不需要任何并行计算。
    • ORB-SLAM [113] * 整合过去十年硬件和算法的进步技术
    • parallel computing;
    • ORB features [131];
      • Ethan Rublee, Vincent Rabaud, Kurt Konolige, and Gary Bradski. 2011. ORB: An efficient alternative to SIFT or SURF. In IEEE Int. Conf. Comput. Vis. 2564–2571.
    • statistical model selection [155];
    • loop closures based on bag-of-words place recognition [26, 41];
      • Dorian Galvez-Lopez and Juan D. Tardos. 2012. Bags of binary words for fast place recognition in image sequences. IEEE Trans. Robot. 28, 5 (2012), 1188–1197.
    • local bundle adjustment [111];
    • graph optimization [81]
      • Rainer Kummerle, Giorgio Grisetti, Hauke Strasdat, Kurt Konolige, and Wolfram Burgard. 2011. G2o: A general framework for graph optimization. In IEEE Int. Conf. Robot. Autom. 3607–3613

6.2.3 基于深度学习的方法

  • 现状 * 最近关于深度学习的研究表明,相机的姿态估计(pose estimation)可以看作是一个学习问题;
    • 目前end-to-end architectures for ego-motion 已经出现[103,171]
    • 但是还没有用于 end-to-end learning for 3D reconstruction的方法
      • 很多方法,仅仅停留在对深度预测上的学习过程
  • 目前 pose estimation 的两类方法 * Supervised Learning * 姿态估计被认为是一个分类问题
    • Konda and Memisevic [78]: 利用立体相机,来预测相机的速度和方向。
      • 利用同步自动编码器(synchrony autoencoders [77]),对训练运动和深度进行表示。
    • DeTone et al. [32] 提出 “HomographyNet”
      • 训练一个CNN,利用单应性的4点参数化,计算两帧之间的单应性(homography)。
    • AlexNet network [79]:
      • 两个连续的图像被输入两个并行的AlexNet网络;
      • 然后将输出连接起来,通过全连接层,regress the camera odometry;
      • 缺点:从AlexNet中提取的特征,并不是视觉测程问题的通用特征,只能在已知的环境中工作。
    • Flowdometry
      • Muller and Savakis [112]提出;
      • 由于用于目标检测和分类的预先训练的卷积层,不适合进行测距估计,所以研究人员转向基于光流的网络结构。
      • 包含两个连续的CNN:
        • 前者用于预测光流,后者用于估计相机运动;
        • 两种网络都使用了FlowNetS[33]架构。
    • Melekhov et al. [103]
      • 开发了一种端到端的CNN,来计算两个视图之间的 ego-motion;
      • 将两个并行的CNN堆叠在一起,分别使用了权值共享和空间金字塔池(SPP)层来处理任意输入图像,同时在 feature maps 中保持空间信息;
      • 回归层由两个完全连接的层组成,用于预测摄像机的平移和旋转。
    • DeepVO * Wang et al. [171]提出;
      • 端到端学习框架,能够通过递归卷积神经网络(RCNN),从图像序列中学习sequential motion dynamics。
      • 评价
        • 优点:相比于VISO2单目系统,和立体声系统,性能更好一点;
        • 缺点:当摄像机前有移动的物体时,可能会降低姿态估计的准确性,但在深度学习框架下如何处理还不清楚。
    • Unsupervised Learning * 思想:最小化与LSD-SLAM类似的光度误差
      • 方法:
    • Zhou et al. [187]
      • 构建了两个平行的CNN网络,来预测深度,和估计摄像机的姿态。
    • Vijayanarasimhan et al. [168]
      • 从卷积/ 非卷积网络,基于深度预测、摄像机运动和动态目标分割的步骤,构建了一个三维场景流(a 3D scene flow);
      • 该场景流,通过摄像机的运动来转换,然后将其反投影到当前帧中,以评估光度误差(photometric error)。

7 讨论部分

7.1 Robust Visual SLAM

7.1.1 Motion Segmentation

  • 1. Background/Foreground Initialization
    • 优点:
      • 当动态物体暂时静止时,也可以跟踪到;
      • 可以处理退化的运动 degenerate motion(如:物体沿极平面运动,或者其方向和速度与摄像机接近)。
    • 缺点:
      • 与背景或其他对象相关的信息,需要事先定义;
      • 这种基于检测的跟踪方案,可能会影响系统的实时性。
  • 2. Geometric Constraints
    • 优点:
      • Kundu et al. [84]
    • 不需要预先知道背景或移动的物体的先验知识;
    • 可以实现实时性。
      • 由于残差的所有计算都是标准的visual SLAM或SfM技术的一部分,因此在执行分割时没有额外的计算负担,因此实时实现是常见的。
    • 缺点:
      • 当动态物体暂时静止时,不能跟踪到;
      • 无法区分由运动目标引起的残差,和由错误对应false correspondence (异常值outliers)引起的残差。
  • 3. Optical Flow
    • 优点:
      • 不需要预先了解环境;
      • 可以实时性工作。
    • 缺点:
      • 对光线变化敏感;
      • 对大块的像素移动,比较敏感;
      • 当对象暂时静止时,需要新的分割。
  • 4. Ego-Motion Constraints
    • 优点:
      • 很容易地从动态特征中分割出静态特征;
      • 可以实时性工作;
      • 可以处理退化的运动 degenerate motion。
    • 缺点:
      • 需要相机的运动的先验信息;
      • 当对象暂时静止时,需要新的分割。对象是临时停止时,它将被视为静态场景的一部分。
  • 5. Deep Learning

7.1.2Localization and 3D Reconstruction

  • 1. 特征驱动
    • 2. 深度学习 * 优点:
      • 减少了特征提取的具体实现过程;
      • 无需预先设定相机模型。
      • 当前方法的主要局限:
        • 如子空间聚类(subspace clustering)中的因子分解(factorization),限制了现有方法的发展方向。
      • 该技术基于数据表征中的非线性能力。
      • 缺点:
        • 构建高效的深度神经网络(DNN)架构较为困难;
      • 动态对象分割与重建涉及复杂的几何运算。
        • 虽然可以通过训练网络实现运动分割(segment motions),但需要解决以下问题:
          • 如何准确识别退化物体运动轨迹;
          • 同时需利用相机固有参数信息来进行深度估计。
      • 在复杂场景下存在挑战:
        • 对于退化物体运动检测而言存在较大难度。
      • 该技术的基础理论依据在于光流原理(the optical flow principle)。

7.2 Dynamic Object Segmentation and 3D Tracking

7.2.1 Dynamic Object Segmentation

  • 1. Statistical Model Selection
    • 优点:
      • 可以处理退化的运动 degenerate motion;
      • 不需要环境的先验知识(当确定有n个不同的运动模型时,可以自动捕获移动对象的数量);
      • 自动处理噪声和异常值(outliers);
    • 由于基于统计的方法适合基于输入集基数的模型;
      • 虽然实现实时仍然很困难,统计模型选择可以实现为一个连续的算法,每次处理一个新的图像。
    • 缺点:
      • 计算代价昂贵;
      • 需要一个关于相机如何随时间移动的假设;
      • dependent motion 仍然是统计模型选择中的一个难题;
    • 由于一组特征可以是两个不同运动模型的一部分。
    • 将重叠运动合并到联合似然函数中[139],可以解决这个问题,尽管在存在异常值情况下仍然很困难。
  • 2. Subspace Clustering
    • 优点:
      • 计算时间成本相对较低,因为它们大多是基于代数方法;
      • 可以处理 dependent motions 问题。
    • 缺点:
      • 不能按 run sequentially ,也不能实时;
    • 因为算法需要整个序列在处理之前(批处理模式)可用。
      • 有些算法需要,场景中 motion 的数量或维度;
      • 如果场景包含一个透视效果,则会失败;
    • 因为大多数方法,使用仿射相机模型。
      • 面对 noise [35, 177], outliers [35, 185], and missing data [128, 179], 处理 long sequences 依然困难。
  • 3. Geometry
    • 优点:
      • 工作在透视相机模式下,因此可以处理非线性流形(a nonlinear manifold)中的数据;
    • 缺点:
      • 不能处理退化的运动 degenerate motion;
      • 计算多个基本矩阵,所需的图像对的数量,随着运动的数量呈指数增长。
      • 噪声、异常值和缺失数据的影响,还没有得到很好的研究。
  • 4. Deep Learning

7.2.2 3D Tracking of Dynamic Objects

  • 1. 轨迹三角化
  • 优点:
    • 它能够逐步处理数据,在每个阶段都可扩展现有结果;
    • 不依赖预先设定的相机运动参数。
  • 缺点:
    • 轨迹三角化的显著缺陷是其对物体轨迹类型有严格的限制;
    • 在存在异常数据或数据丢失的情况下仍难以获得准确结果;
    • 它只能实现基于刚体运动的重建效果。
  • 2. 粒子滤波器
  • 优点:
    • 是目前唯一能在实时条件下完成动态目标跟踪及三维重建的技术。
  • 缺点:
    • 其计算开销非常大,并且主要适用于有限种类的目标对象;
    • 在面对非刚性重建时表现不足。
  • 因为涉及非刚性运动与非等速运动模型之间的不匹配问题,
  • 所以在应用该方法时必须谨慎考虑这些限制因素。

7.3 Joint Motion Segmentation and Reconstruction

7.3.1 Factorization

  • 1. 多体结构运动估计(MBSfM)
  • 2. 非刚性结构运动估计(NRSfM)
  • 优点:
    • 可同时解决运动分割与重建问题;
    • 不需预先掌握相机运动参数;
    • 能优雅地扩展至非刚性重建领域。
  • 缺点:
    • 难以适用于存在显著透视变形的场景;
      • 因为大多数方法都假设基于正投影(orthography)或仿射相机模型;
      • 即使存在透视变形,只要恢复投影深度优先级即可实现重建。
    • 不具备实时性;
      • 所有特征点轨迹必须在批处理模式下进行预处理。
    • 复杂度为O(f p²);
    • 需要依赖于先验信息:
      • 如场景中移动对象的数量、测量矩阵的秩或对象的空间维数等。
    • 对噪声和异常值较为敏感;
    • 数据缺失问题同样不容忽视;
      • 因为在应用SVD分析之前,则度量矩阵的所有entry必须是完整的。

8 发展趋势与总结

  • 本文核心关注点
  • 系统性分析现有方法的基础上,在SfM及视觉SLAM领域与动态对象分割及跟踪进行了整合研究。
  • 未来的挑战
  • 应对缺失数据、噪声干扰以及异常值(missing data, noisy data, outliers)的技术难题
  • 针对退化运动模式下的困难情况
  • 实时性要求下的技术瓶颈
  • 为了满足实时性需求,在整合动态目标分割及三维重建技术方面仍面临诸多限制
  • 深度学习带来的创新视角
  • 基于深度学习的方法正在逐步成熟
  • 这一领域的发展前景为相关技术的研究工作提供了丰富的课题选择

9 经典论文

  • Andrew J. Davison, 2003: "Real-time Simultaneous Localisation and Mapping" with a single camera, presented at IEEE International Conference on Computer Vision.
  • MonoSLAM [29]: Represents the first filter-based SLAM approach, effectively transferring the SLAM problem from robotics to pure visual domains.
  • Under real-time computational constraints for robot navigation, this method achieves camera position uncertainty propagation and feature measurement through a Bayesian framework.
  • Hugh C. Longuet-Higgins' seminal work [53]: Laid the foundation for Structure from Motion (SfM) techniques by introducing the eight-point algorithm under epipolar geometry conditions.
  • This algorithm calculates relative camera poses using two-view eight-point correspondences.
  • David Nister's influential paper [X]: Introduced an efficient solution to the five-point relative pose problem, which has become a cornerstone in backend optimization for Structure from Motion applications.
  • 五点视觉定位算法用于求解相机姿态。

  • Davide Scaramuzza, Friedrich Fraundorfer, and Roland Siegwart (2009). "Real-time monocular visual odometry for on-road vehicles using a one-point RANSAC approach" presented at the IEEE International Conference on Robotics and Automation (Robotics), pages 4293–4299.

  • 一种基于单目标(1-point)的算法用于估计 camera pose(camera ego motion)。该算法通过结合轮式车辆特有的非完整运动约束条件来计算 camera 运动,并假设 camera 的运动轨迹为平面或圆形。
    Monocular reconstruction of vehicles: Integrating Simultaneous Localization and Mapping (SLAM) with shape priors In IEEE Int. Conf. Robot. Autom.(ICRA) 2016
    5758–5765

  • 基于单一摄像头的空间重建技术研究中将视觉定位算法(SLAM)与形状先验相结合

    • Thomas S. Huang and Arun N. Netravali. 1994. Motion and structure from feature correspondences: A review. Proc. IEEE 82, 2 (1994), 252–268.
  • 探讨了SfM算法的早期发展:特别聚焦于基于特征匹配类型的三维重建算法及其性能表现。

  • Francisco Bonin-Font, Alberto Ortiz, Gabriel Oliver, Francisco Bonin-Font Alberto, and Ortiz Gabriel. 2008. Visual navigation for mobile robots: A survey. J. Intell. Robot. Syst. 53 (2008), 263–296.

  • 探讨了移动机器人视觉导航技术,并将其划分为基于地图的导航和无地图的导航方法。

  • Their 2004 work, titled "Multiple View Geometry in Computer Vision" (second edition), was published by Cambridge University Press.

  • ·在计算机视觉领域中被公认为经典之作的多视几何理论(MVG),由Hyon Lim、Jongwoo Lim和H. Jin Kim于2014年提出。

  • 在大规模环境中实现实时6自由度单目视觉SLAM算法的研究与应用。

  • David Nistér及其合著者在2004年首次系统性研究了基于视觉信息的移动物体定位技术。
    **Pattern Recognit. 652–659.
    [117]

    • 视觉测距(VO),经典论文。
    • Herbert Bay, Andreas Ess, Tinne Tuytelaars, and Luc Van Gool. 2008. Speeded-up robust features (SURF). Comput.
      Vis. Image Underst. 110, 3 (2008), 346–359.
  • 特征提取方法SURF,在计算机视觉领域具有重要地位。

    • Martin A. Fischler和Robert C. Bolles在1981年首次提出随机采样一致性的概念,这一开创性工作奠定了模型拟合的基础。
      • 随机采样一致性的理论来源及其经典的拟合方案。
    • Etienne Mouragnon等2009年提出的基于全局光束平差技术的方法具有广泛的适用性和实时性。
      • 全局光束平差技术在结构从运动中的应用及其高效实现。
    • Raul Mur-Artal及其团队开发的ORB-SLAM算法成为单目SLAM领域的代表性解决方案。
      • ORB-SLAM方案以其通用性和精确度著称。

      • ORB-SLAM 经典方法,较新的方法。

论文颜色标注说明 : 蓝色--经典常引用论文; 青绿色--潜在感兴趣论文。

全部评论 (0)

还没有任何评论哟~