twice论文-深度估计-Don’t Forget The Past: Recurrent Depth Estimation from Monocular Video

阅读量：

这篇论文大致阅读后感觉不错。其中作者引入了一个LSTM层，并成功实现了序列数据处理的能力，在实验中验证了该方法的有效性

0 摘要：

换句话说，在自动驾驶等场景中，持续更新深度信息是必要的。然而目前所获得的深度数据仅限于独立帧，在视频中的每一帧与其他帧之间基本上是相互独立的。因此我们需要建立一种能够使视频帧之间关联起来的方法——即基于时间序列的一系列深度图。此外我们将三种不同的深度估计方法整合进一个统一框架中然后将该框架与卷积LSTM网络相结合从而能够生成具有时空特性的时间序列深度估计结果。The method is versatile, as it can effectively integrate various depth estimation techniques.

1 介绍

2 相关工作

重点讲述了监督学习框架下的深度估计技术及其应用，并结合自监督学习方法弥补传统传感器数据不足的问题。此外，在研究领域中还涉及了基于视频序列的深度感知技术。值得注意的是，在本研究中我们主要关注的是基于视频序列的分析。

3.方法

3.1 监督学习的深度估计

3.2自我监督的深度估计

3.3深度补全

3.4本文学习时间序列的深度图

简单来说，在这三种方法都进行了详尽研究的前提下，在同一时间段内的每一帧都是各自独立且没有相互关联。自我监督的方法仅限于使用相邻帧在训练阶段来计算视图合成损失；然而这些关键的时间序列结构并未被充分挖掘出来。因此本节将提出一种框架以扩展上述三种方法使其能够在训练与测试过程中应用基于时间的数据序列

我们把深度恢复问题归类为从多模态数据（包括图像与稀疏深度图）的时间序列到数据（如稠密深度图）的时间序列的归一化处理问题；该方法基于自我监督学习框架进行优化，并在此基础上提出了一种改进方案。本研究关注当前时刻生成的密集度分布图。

，给定之前k个时候的密集深度图

（at{D_{t-1}},at{D_{t-2}}......at{D_{t-k}}）

(

),当前时刻图像的编码特征

，则

（我不知道这个为什么求最小，理解错了吗）

前述我们通过增加空间-时间相关性，在实现过程中对空间-时间关系进行建模。我们采用了ConvLSTM网络作为核心组件，并在图像深度预测中添加了前述的核心组件。其应用位置是在编码器之后的位置。编码器能够生成相应的特征表示。

,然后ConvLSTM的输入和输出入下：

解码器，生成深度图：

4 训练框架

网络架构

该系统整体架构由深度预测模块与姿态估计子网络共同构成。其中两个编码器均采用了独立的ResNet-18结构，在解码阶段的设计中，并行地采用了四个上采样卷积模块。其工作流程如下：编码器输出经由ConvLSTM处理后传递至下一时间步，在此过程中通过接收前后帧之间的隐藏状态信息以及细胞状态来完成。随后系统会从各个解码模块中提取不同分辨率的空间位差信息。而姿态分支则由单层卷积（分别为1x1和3x3）组合而成，在这一过程中能够准确地捕捉物体的姿态变化特征，并将这些特征转化为六元素向量表示。这些向量不仅包含了旋转参数的信息还包含了平移参数的信息即所谓的外参参数。为了能够准确恢复物体的空间结构信息因此必须利用这些外参参数来进行计算

ConvLSTM的一些训练的策略

包括隐藏状态的初始化，解决过拟合的问题。

5 实验

5.1 分别和监督，自监督和补全的baseline进行比较分析

5.2 消融研究

预训练的隐藏状态和初始为0的隐藏状态的比较

激活函数使用ELU来代替Tanh去解决梯度消失的问题

训练的序列长度的问题

6 结论

该论文提出了一种新的基于时间序列深度图的方法用于单目视频与稀疏深度估计，并通过循环网络结构实现了时空数据相关性的建模。该网络模型在监督式深度估计、自监督式深度估计以及填补缺失数据等方面均得到了实际应用。

有错误，继续改进

全部评论 (0)

还没有任何评论哟~

twice论文-深度估计-Don’t Forget The Past: Recurrent Depth Estimation from Monocular Video

这篇论文大体看下来，感觉加了个LSTM，这样可以使视频在每一帧有时空上的连续性。 0摘要：就是说像自动驾驶之类的需要连续的更新深度信息，但是目前得到的深度都是独立帧的，视频的帧与帧之间是相互独立的，...

twice论文--深度估计--Consistent Video Depth Estimation

0摘要：本文提出了一种用于密集重构，估计所有像素上的一个几何一致性的深度的算法，用的图片是单目视频。我们利用传统的sfm重构去再每个像素上构建几何约束。不像经典的重构方法，我们使用了一个基于学习的方...

twice论文-深度估计-DEEPV2D: VIDEO TO DEPTH WITH DIFFERENTIABLE STRUCTURE FROM MOTION

使用可微分的sfm求得视频中的深度 0摘要：说的是讲深度学习和图像的几何原理结合起来进行端到端的学习，分为两个阶段：运动估计和深度估计 1介绍：就是说从视频中求得深度图，传统的的方法是使用sfm,...

单目深度估计(Monocular Depth Estimation)论文阅读 2021-01-15

单目深度估计问题公式化：求非线性映射函数一、数据集： NYUDepth：视频序列和densedepthmap通过RGBD采集的，但是不是每一种图像都有深度图，因为映射是离散的。

【论文】单目深度估计：Unsupervised Monocular Depth Estimation with Left-Right Consistency

UnsupervisedMonocularDepthEstimationwithLeftRightConsistency 摘要不像之前的有监督的方法一样，利用深度图作为标签（GT），本文的方法用容易...

论文笔记-深度估计(5)Unsupervised Monocular Depth Estimation with Left-Right Consistency

ECCV2016UnsupervisedMonocularDepthEstimationwithLeftRightConsistency 本文采用无监督学习（没有groundtruth）的方法来估计深...

单目深度估计论文阅读—《Deep Learning-Based Monocular Depth Estimation Methods—A State-of-the-Art Review》

单目深度估计论文阅读—《DeepLearningBasedMonocularDepthEstimationMethods—AStateoftheArtReview》作为一个深度学习单目深度估计方向的...

Consistent Video Depth Estimation——视频深度一致估计

PaperCode 文章核心：提出一种算法——重构单眼视频中所有像素的稠密的几何一致的深度，其利用了传统的SFM（从运动中重构）来建立视频中像素的几何约束。与经典重建中的特殊先验不同的是，本文使用的...

《Depth from Videos in the Wild：Unsupervised Monocular Depth Learning from Unknown Cameras》论文笔记

参考代码：depthfromvideointhewild 1\.概述导读：在这篇文章中提出了一种自监督深度估计算法，总体上看文章的算法是与monodepth2方法存在一定程度关联性，它们都是采用视频...

Depth Estimation Summary 深度估计

求取场景所对应的深度值比较常用的方法是从kinect的红外传感器中得到深度NYUDepthV2或者借助于激光雷达（KITTI），kinect虽然比较廉价，但是所采集到的深度范围超过4mkinect估...

是否确定退出登录?

twice论文-深度估计-Don’t Forget The Past: Recurrent Depth Estimation from Monocular Video

全部评论 (0)

相关文章推荐

twice论文-深度估计-Don’t Forget The Past: Recurrent Depth Estimation from Monocular Video

twice论文--深度估计--Consistent Video Depth Estimation

twice论文-深度估计-DEEPV2D: VIDEO TO DEPTH WITH DIFFERENTIABLE STRUCTURE FROM MOTION

单目深度估计(Monocular Depth Estimation)论文阅读 2021-01-15

【论文】单目深度估计：Unsupervised Monocular Depth Estimation with Left-Right Consistency

论文笔记-深度估计(5)Unsupervised Monocular Depth Estimation with Left-Right Consistency

单目深度估计论文阅读—《Deep Learning-Based Monocular Depth Estimation Methods—A State-of-the-Art Review》

Consistent Video Depth Estimation——视频深度一致估计

《Depth from Videos in the Wild：Unsupervised Monocular Depth Learning from Unknown Cameras》论文笔记

Depth Estimation Summary 深度估计