RGB-D Camera 汇总

阅读量：

1. RGB-D Camera

1）深度测量技术分类

2）各种方案的比较

3）Three-dimensional vision sensor technology comparisons

1.1 双目摄像头 (Stereo Camera)

1）原理：

Many stereo methods acquire depth values at points where either corresponding features or texture information is present.
- The accuracy of stereo systems is influenced by their configuration, with typical parameters including baseline and focal length.

- Stereo Matching

2）特点：该方案具有较高的分辨率（即图像捕捉精准），然而其体积较大导致不适用于移动端设备使用（即难以应用到移动设备如手机、VR头显等）。该结构光方法存在光线敏感性问题（即抗光性差），并且不具备近端成像能力（即不能在近距离使用）。

3）代表：Leap Motion

1.2 结构光 (Structured Light)

原理

The accuracy is influenced by the configuration settings and is affected by parameters including baseline, focus, and light patterns.

2）代表：Kinect V1

1.3 TOF (Time of Flight)

1）原理：

- 测量发射与反射红外(IR)信号的相位延迟(phase-delay)

- 计算每个sensor像素到目标物体的距离

时延可以通过四个电荷量之间的关系来计算。这四个控制信号之间具有90度的时延差异。c = 3×1e8 m/s

The operational range spans from 0.8 meters to a maximum of 3.5 meters, with the spatial resolution achieving a precise measurement of 3mm when determined at a distance of 2 meters. The depth resolution recorded under the same conditions is approximately 10mm, while the field of view measures 57 degrees in height and extends to a width of 43 degrees, providing comprehensive coverage.

基于光时间差（ToF）原理的传感器阵列由多个距离传感器单元构成。相比之下，在功能上有所提升（与传统成像传感器相比），但该传感器本质上仍是一个典型的CMOS芯片。鉴于此，在系统相关电子设备（如模拟-数字转换器等）旁边安装成像和三维测量能力是可行的。值得注意的是，整个传感器的计算处理能力都集成在芯片上；这意味着每个像素都能独立计算距离。因此，“智能像素”（ToF pixels）这一术语也被广泛采用。

2）主要问题：

- 精确度低、空间分辨率低

- 运动模糊 (motion blur 相机运动或目标运动)

尽管当前精度达到厘米级别，在性能上仍较Leap Motion等毫米级设备存在不足；然而现有的设备在体积和成本上已经超越了Leap Motion等先进产品，并且未来有望进一步缩小尺寸以具备嵌入移动设备的能力

4）代表：Kinect V2

目前主要的TOF相机厂商包括PMD、MESA、Optrima以及微软等。其中，在科研领域的应用较为广泛的是MESA型号。其设备体积小巧且性能稳定，在光谱分辨率方面表现优异；而PMD系列则是唯一具备户外与户内双场景下的应用能力，并支持多种探测距离设置；不仅适用于科研场景，在工业和其他领域也展现出广泛的应用潜力。此外,Optrima系列与微软旗下的相关设备则聚焦于家庭娱乐及休闲娱乐领域

1.4 光编码（Light Coding）

光编码（Light Coding）技术（源自PrimeSense）：与传统的ToF或结构光测量技术不同的是，Light Coding采用了持续光源而非脉冲光源，并无需定制专用的CCD传感器即可采用普通的CMOS图像传感器。这样一来不仅降低了硬件成本还简化了系统架构使方案的整体成本大幅下降。

Light Coding, 简单来说就是利用光源照射到被测空间并对其进行编码的技术。

在执行此操作之前，请确保完整记录整个空间区域的所有散斑图案以便后续处理工作能够顺利开展因此需要先完成光源标定过程根据PrimeSense的技术文档中描述每隔一定间距选取多个基准面来进行数据采集假设按照Natal技术规范用户的活动范围设定为距离电视墙1米至4米之间则每隔10厘米的距离选取基准面总共会获取了共30张二维散斑图当进行测量时对待测环境拍摄了一组二维散斑图随后将这一组待测二维散斑图与之前的每张标准图进行比对计算从而获得30个对应度值这些对比计算结果能够帮助确定物体存在于空间中的具体位置通过对比计算结果定位物体存在的位置并找到其对应的峰值坐标进而完成三维重建过程

2. 目前主要RGB-D产品

产品	延迟	FPS	DOF	感应角度	使用距离	焦距	价格	技术方案
LeapMotion	10ms	120Hz	26	120度	70cm以内	30cm	699	双目摄像头
uSens	16ms	60Hz	26	120度	70cm以内	30cm	699	双目摄像头
微动	10ms	100Hz	23	120度	70cm以内	40cm	699	双目摄像头
Nimble	25ms	45Hz	110度	0-1.2m	无需定焦	699	TOF
ThisVR	16ms	60Hz	26	110度	0-1.5m	无需定焦	299	TOF
Kinect One	30ms	30Hz	60度	0.5-4m	无需定焦	999	TOF
Intel(Omek)	33ms	30Hz	90度	1-3	1m外	1099	结构光
奥比中光	33ms	30Hz	1-3	0.5m外	999	结构光

ToF: SoftKinetics, PMD, MSFT

SL(Structured Light): PS, Intel, Mantis, Morvidius

Stereo: Intel

3. Kinect V1 VS Kinect V2

3.1 Sensor配置比较

Kinect V1	Kinect V2
颜色（Color）	分辨率（Resolution）	640×480	1920×1080
fps	30fps	30fps
深度（Depth）	分辨率（Resolution）	320×240(upsample:640x480)	512×424
fps	30fps	30fps
人物数量（Player）	6人	6人
人物姿势（Skeleton）	2人	6人
関節（Joint）	20関節／人	25関節／人
手的開閉状態（Hand State）	△（Developer Toolkit）	○（SDK）
检测範囲（Range of Detection）	0.8～4.0m	0.5～4.5m
角度（Angle）（Depth）	水平（Horizontal）	57度	70度
垂直（Vertical）	43度	60度
（Tilt Motor）	○	×（手動）
複数的App	×（単一的App）	○

（注：V1的要求是USB2.0理论传输速率是60MB/s，V2是USB3.0理论传输速率是500MB/s。可以计算一下，以XRGB Color为例，30fps，那么每秒所需传输的数据大小为640 x 480 x 4 x 30约为35M；再加上USHORT格式的Depth Color，30fps，大小为320 x 240 x 2 x 30约为4M。总计约为40MB/s，因为带宽有限，所以在保证画面帧率稳定的情况下，分辨率只能如此，而且基本上必须独占一个USB Controller。再算算v2的情况，Color = 1920 x 1080 x 4 x 30 约为237M，Depth = 512 x 424 x 2 x 30约为12M，总计约为250M/s。所以非USB3.0不可，否则传输不了这么大的数据量。显而易见，Color Map是最占带宽的，其实可以通过一些其他格式，比如I420或MJPG来减少数据量，然后通过CPU或GPU来进行解压和回放。）

3.2 Kinect V1的关节图

3.3 Kinect V2的关节图

新增了头部（HEAD），末端（HAND_TIP_LEFT,HAND_TIP_RIGHT）以及小节（THUMB_LEFT,THUMB_RIGHT）共计五个关节

3.4 应用架构

想再和大家分享一位人工智能教学的大牛的课程吧？完全零基础！一学就会！趣味横溢！里面还有一些搞笑的小插曲！希望这个课程一定能让你在人工智能领域找到自己的位置哦！[()

全部评论 (0)

还没有任何评论哟~

RGB-D Camera 汇总

首先给大家分享一个巨牛巨牛的人工智能教程，是我无意中发现的。教程不仅零基础，通俗易懂，而且非常风趣幽默，还时不时有内涵段子，像看小说一样，哈哈～我正在学习中，觉得太牛了，所以分享给大家！点这里可以跳转...

RGB-D Camera 汇总

1\.RGBDCamera 1）深度测量技术分类 2）各种方案的比较 3）Threedimensionalvisionsensortechnologycomparisons 1.1双目摄像头Stere...

经典论文回顾 - RGB-D SLAMv2 : 3D Mapping with an RGB-D Camera

前言本文属于RGBDSLAMv2的论文，2013年发表于机器人领域顶级期刊TRO。一作FelixEndres，导师团都是大牛：弗莱堡大学WolframBurgard教授，也是书籍《概率机器人》的作...

RGB-D Slam 总结

一.引言首先，我们需要知道什么是SLAM（simultaneouslocalizationandmapping，详见SlamCN），SLAM，即时定位与制图，包含3个关键词：实时、定位、制图，就是实...

YUV转RGB汇总

region彩色图像记录的格式，YUV转RGB /YUV,http://zh.wikipedia.org/wiki/YUV.E5.B8.B8.E7.94.A8.E7.9A.84YUV.E6.A0.BC...

视觉slam中的相机模型汇总 | 单目、双目、RGB-D

点击上方“3D视觉工坊”，选择“星标” 干货第一时间送达作者：梦寐mayshine 链接：https://zhuanlan.zhihu.com/p/94233848 本文转载自知乎，作者已授权，未经...

RGB-T行人检测汇总

RGBT行人检测汇总 1.介绍 2015年，第一个RGBT行人检测数据集KAIST被提出，多光谱行人检测任务逐渐成为计算机视觉领域的研究热点之一。可见光相机可以在光照条件良好的条件下清晰地捕捉到行人的...

android camera rgb,Convert Android camera2 api YUV_420_888 to RGB

问题 Iamwritinganappthattakesthecamerafeed,convertsittorgb,inordertodosomeprocessing. Itworksfineonthe...

android camera ycbcr420sp转为rgb

获取android手机上的图片，可以设定获取的图形格式，包括对于通过调用previewcallback获取的原始ycbcr420sp格式的图像，通常要将其转换为rgb24格式的，才能进一步显示或处理...

Android MTK Camera 项目问题汇总

一、打开微笑快门，不能切换前后camera 前摄像头没有加微笑快门的拍照模式。在使用前摄像头时，被拍的人可以在屏幕上看见拍下的场景，拍照的时机可以自行决定。使用者完全可以在微笑时自行按下拍照键完成拍照...

是否确定退出登录?

RGB-D Camera 汇总

1. RGB-D Camera

1.1 双目摄像头 (Stereo Camera)

1.2 结构光 (Structured Light)

1.3 TOF (Time of Flight)

1.4 光编码（Light Coding）

2. 目前主要RGB-D产品

3. Kinect V1 VS Kinect V2

3.1 Sensor配置比较

3.2 Kinect V1的关节图

3.3 Kinect V2的关节图

3.4 应用架构

全部评论 (0)

相关文章推荐

RGB-D Camera 汇总

RGB-D Camera 汇总

经典论文回顾 - RGB-D SLAMv2 : 3D Mapping with an RGB-D Camera

RGB-D Slam 总结

YUV转RGB汇总

视觉slam中的相机模型汇总 | 单目、双目、RGB-D

RGB-T行人检测汇总

android camera rgb,Convert Android camera2 api YUV_420_888 to RGB

android camera ycbcr420sp转为rgb

Android MTK Camera 项目问题汇总