三维重建(SFM)与实时定位建图(SLAM)的区分与联系
1、SLAM
SLAM主要被称为Simultaneous Location and Mapping技术(SLAM),它是一种旨在利用特定传感器的装置或系统,在未知环境中通过运动自动构建地图并确定自身位置的技术框架。该方法无需依赖任何环境先验信息的基础框架下完成对环境空间模型的构建,并通过实时反馈机制实现对主体位姿(即位置与姿态)的状态估计与优化更新。其核心目标是实现机器人实现自身定位与环境地图构建这两个基础性任务,并且必须能够在动态环境中实时更新位姿估计与空间模型。
2、SFM
Structure from Motion(SFM)涉及估算相机内外参数及其作用于三维空间中的物体的位置与形状问题。通常指:在一个二维图像序列中识别并跟踪一系列共有的目标物或场景元素,并通过这些信息推断出相机运动轨迹及其内部几何特性。这一过程一般包括以下步骤:首先,在每一幅二维图像中识别特征标记或关键点;其次,在不同视角之间建立对应的几何关系;随后,排除那些不满足几何一致性检验的结果;最后通过迭代优化算法实现对外参数和内参数的有效估计,并利用三角测量技术计算出各三维空间点的位置坐标。
根据SfM过程中的图像添加顺序所体现的拓扑结构特征,SfM方法主要分为增量式的(Incremental/Sequential)、全局式的(Global)、混合式的(Hybrid)以及层次式的(Hierarchical)类型.此外还有基于语义的理解型(Semantic)和基于深度学习的学习型(SBMF).
3、区别
- 实时处理需求下, SLAM系统接收的数据呈现线性顺序, 无法一次性获取全部图像信息, 因此某些SLAM算法可能会遗失过去的部分数据;基于图像的结构光法(SFM)则不需要实时处理, 可以一次性输入全部图像, 并充分利用所有信息。
- SLAM系统所面临的是一种具有动态特性的挑战, 它需要应用滤波技术来解决运动学原理下的相关问题;相比之下, 单纯的图像处理仍然是SFM的主要研究领域。
SLAM:主要基于定位技术,并辅助构建地图;对速度的要求超过精度;并且倾向于轻量化设计与小型化方向发展
SFM:基于这一框架设计,在建图过程中占据主体地位,并配合定位技术辅助实现;为了提升整体性能要求而实施了更高精度算法;旨在支持大规模场景构建,并在动态变化的复杂环境中进行高效重建。
SLAM的核心功能是实现位置估计
SFM与SLAM的主要功能是相同的,在目标上也是一致的——它们都旨在解决相机姿态问题,并且都能生成三维稀疏点图。值得注意的是,在精度要求上更为严格的不同在于它们对精度的要求更为苛刻:在能够进行BA的地方通常也会执行BA操作。

4、联系
- 基本理论具有共通性,在多视角几何框架下展开;
- 传统的解决方案往往涉及特征提取及对应匹配过程;
- 在优化过程中均需关注投影误差这一关键指标;
- 回环校正与基于SfM的全局配准本质上属于同一范畴。
