Advertisement

A simple yet effective baseline for 3d human pose estimation

阅读量:

A simple yet effective baseline for 3d human pose estimation

主要工作

在以往的人体3D关键点检测的方法中,默认情况下有两种主要类型:一种是搭建基于full-end网络的方法;另一种则是首先采用先进行二维关键点检测的方法获取2D的关键信息;随后通过配准关系建立三维模型。

这项工作的核心在于构建一个神经网络架构以完成从二维人体关键点到三维人体关键点之间的对应关系建立这一目标

  1. 构造了一个高效的2D转关键点转3D关键点的 神经网络

实现细节

网络结构

这里写图片描述

作者参考了如图所示的Resnet residual模块,并将其命名为block结构;每个Block中包含两个Linear层;每一个Linear层之后依次包含Batch normalization、ReLU和Dropout层。

此外,在每个block之前又引入了额外的全连接层用于将输入端的特征图中的节点数量从\ 16\times 2提升至\ 1024维,并且同样地,在网络末端也引入了另一个全连接层用于将\ 1024维的数据压缩至\ 16\times 3维度的空间。

在网络中,block的数量可多可少,这里作者一共使用了两个block。

网络输入和输出

输入: 2D关节点的坐标,16*2表示的是16个关节点,每个关节点的坐标是二维的

输出:3D关节点的坐标, 16*3

训练细节

训练数据: Human3.6M: http://vision.imar.ro/human3.6m/description.php

训练参数: Epoch=200, Adam,batch_size=64,weight init=Kaiming initialization, lr=0.001

全部评论 (0)

还没有任何评论哟~