Advertisement

Fine-Grained Head Pose Estimation Without Keypoints

阅读量:

该系统提供了一种用于头部姿态预估的具体方法,并在教育平台详细介绍了这一技术路径

论文地址:https://arxiv.org/pdf/1710.00925.pdf

github源码地址:https://github.com/natanielruiz/deep-head-pose

Abstract

基于目标面部关键点估计和平均人体模型解决2D至3D的对应关系。
我们对该传统方法持批评态度。
为此设计了一种多损失卷积神经网络架构。
将姿态分类与图像强度预测相结合,并进而推导出固有欧拉角参数(包括 roll, pitch, 和 yaw)。
我们在标准深度姿态估计数据集上进行了实验验证,并与当前最先进的深度姿态估计技术进行了对比分析。

Introduction

自古以来,已知的主要建模方案主要包括:基于关键点识别;以及参数化外观模型。然而,在过去几十年中研究的主要方向则聚焦于:通过深度学习技术直接从二维图像中提取面部关键点。

我们的主要工作有:

1.提出了一种用于预测欧拉角的新方法,在计算过程中通过构建复合损失网络来同时计算三个旋转轴的欧拉角。

a pose bin classification与a regression component

Method

数据库:300WLP dataset

多复合损失方法

之前研究者采用了综合标准差作为一个单一的指标来进行预测。然而,在实际应用中发现该方法未能实现最佳效果。随后将整个计算过程分解为三个独立的部分分别进行预测。每个损失函数被定义为两个基本损失函数的加权和。

我们对于回归损失的权重进行调整,并将分类的权重设置为1.

其中第一个参数代表交叉熵,第二个参数代表标准差。

预测的效果:

dataset

该研究采用了AFLW2000和BIWI两个数据库,在数据集中涵盖了不同姿态下的角度变化范围。具体而言,研究覆盖了 yaw轴的变化幅度为±75度、pitch轴的变化幅度为±60度以及 roll轴的变化幅度为±51度。

低分率的效果

通常而言,在图像处理领域中基于关键点定位的方法在分辨率方面有着较高的需求。然而我们所提出的新型方法在此方面的限制更为宽松。现有研究表明现有的深度学习模型中尚未有针对低分辨率图像进行有效识别任务的应用实例。

实验效果

在AFLW2000上进行测试

后期再补

全部评论 (0)

还没有任何评论哟~