Robust Odometry Estimation for RGB-D Cameras
1.Robust Odometry Estimation for RGB-D Cameras
Author: Christian Ked, Jiirgen Sturm, and Daniel Cremers
文章目录
- 1.Robust Odometry Estimation for RGB-D Cameras
-
- 一、个人总结
- 二、论文笔记
-
- 1. Direct Motion Estimation
- 2. Robust Motion Estimation
- 3. Evaluation
- 4. Conclusion
一、个人总结
研究背景:怎么在没有外部参考系的情况下实现导航和位置控制?
研究问题:以高帧速、低时延计算运动更新量,并使运动估计的更新量对离群点鲁棒。
前人成果:
- 单目和双目常用基于特征的方法跟踪运动,通过RANSAC提高鲁棒性。同时,使用BA改善估计结果。缺点是:忽视了很多有价值的信息。
- 使用稠密的方法介绍了四个。其中最后的例子证明使用RGB-D图像的VO能在静态场景下获得较高的精度。
- 最近的工作表明:通过当前图像和场景模型匹配,而不是和前一帧匹配,稠密方法的精度可以提高。典型例子是KinectFusion和DTAM。为了实现对离群点的鲁棒,许多方法使用二值化去把图像分为内点和离群点,或者使用稳健统计学中连续性方法。鲁棒化误差函数在像BA这样的领域也是很常用的。
- 有几种方法在运动估计值使用非均匀分布的先验来指导优化过程朝向正确的结果。这些先验可以来自运动假设、其他传感器的测量和滤波。
- 和先前的工作相比,作者提供了一个模型的概率推导。优点:这个公式能使我们根据应用选择合适的传感器和运动模型。作者建议使用基于t分布的鲁棒传感器模型和匀速运动先验。
本文贡献:
- 基于RGB-D数据,提出了用于直接运动估计的概率公式。
- 来自真实世界的鲁棒传感器模型。
- 先验的整合。
二、论文笔记
1. Direct Motion Estimation
基于灰度不变假设。
A. Warping Function
B. Likelihood function

p(\xi)表示的就是相机运动的先验分布,可以是均匀分布、IMU的测量数据、卡尔曼滤波的预测结果。
C. Maximum A Posteriori (MAP) Estimation

(14)式中的p(\xi)是在连乘号外面。若只考虑似然概率,有:

(16)式中推导应为:
\frac{\partial\log p(r_i|\xi)}{\partial \xi}=\frac{\partial\log p(r_i|\xi)}{\partial r_i}\frac{\partial r_i}{\partial \xi} =\frac{\partial\log p(r_i)}{\partial r_i}\frac{\partial r_i}{\partial \xi}=0
在\frac{\partial\log p(r_i|\xi)}{\partial r_i}中,\xi是满足方程的解,也就是MAP问题的最优解。因此,p(r_i)应该是最优解\xi处的先验分布。如果p(r_i)是正态分布的函数,则\omega(r_i)为常数,这就是一般的最小二乘问题。若p(r_i)不是正态分布,则\omega(r_i)就不是常数,这就变成了加权的最小二乘问题。
作者在不同的p(r_i)分布函数下给出了对应带权重残差的大小。

从(a)图看出,当p(r_i)是t分布时,满足对较大残差项进行抑制的要求,即乘以一个较小的权重。(b)图给的是在"fr1/desk"数据上获得的残差直方图,最满足的分布是t分布。
D. Linearization(解最优化问题)
(18)式是非线性问题,求解该问题的方法是:把r_i(\xi)线性化,即在\xi=0时泰勒展开,有:

J_i\in\reals^{6},是个行向量。把所有j_i按行写在一起,则优化问题,(18)式变为:
Wr(\xi)=W(r(0)+J\triangle\xi)^T(r(0)+J\triangle\xi)=W[r(0)^Tr(0)+2r(0)^TJ\triangle\xi+\triangle\xi^TJ^TJ\triangle\xi]
对上式求导有:
\frac{\partial W[r(0)^Tr(0)+2r(0)^TJ\triangle\xi+\triangle\xi^TJ^TJ\triangle\xi]}{\partial \triangle\xi}=2WJ^Tr(0)+2WJ^TJ\triangle\xi=0
则有:

从而可以求出\triangle\xi的取值。
2. Robust Motion Estimation
A. Sensor Model ( 即p(r_i|\xi) )
对于无权重的残差优化问题,传感器模型就是正态分布。然而,从图中3(b)中可以看出正态分布并不能很好地拟合真实情况。在本论文中,以"fe1/desk"建立的残差直方图最优的传感器模型是假设为t分布。

这里面的t分布是一个广义t分布,它有三个参数:均值\mu,方差\sigma^2和自由度\nu。其中,\mu=0。能得到权重函数为(22)。

\sigma^2是残差项的方差,式(23)就是在每次用(21)式迭代完之后,对权重函数的更新公式。论文上说对(16)的优化问题采用IRLS算法,但是权重的更新和IRLS中权重更新的方式不一样。
B. Motion Prior
(16)式的问题没有考虑运动先验。现考虑,假设匀速运动模型,则有p(\xi_t)=N(\xi_{t-1},\varSigma)。优化问题的解为:
WJ^Tr(0)+WJ^TJ\triangle\xi+\varSigma^{-1}(\triangle\xi-\xi_{t-1})=0
最后化为:

(24)式中的\varSigma^{-1}(\xi_{t-1}-\xi^{(k)}_{t})代表的是第k次迭代的结果。因为求解最优化问题采取的是迭代的方法,每一次\triangle\xi的分布会发生改变。第k+1次迭代时p(\triangle\xi)=N(\xi_{t-1}-\xi^{(k)}_{t}),\xi^{(k)}_{t}表示的是第k次迭代后求得的\xi值。
实验结果:

3. Evaluation
评价标准:RMSE、Runtime。
三个模型:无权重、Tukey 权重、t分布权重。
两组参数:realtime(图像320x240)、precision(图像640x480)
两个场景:合成图像、TUM RGB-D数据集
4. Conclusion
推导出一个直接估计相机运动的概率公式,这个概率公式可以使用自定义的传感器和运动模型的概率分布。在作者的应用中,使用t分布能更好的匹配观察到的误差,并实现更高的精度。更重要的是,运动先验能在有动态物体的最优化问题中有更好的运动估计。通过实验证明,作者的方法精度高、鲁棒、比之前的工作好。未来作者的目标是在四轴飞行器中应用这个算法来补偿短期的运动漂移。
