GazeNeRF: 3D-Aware Gaze Redirection with Neural Radiance Fields

阅读量：

1.Introduction

1.1什么是 Gaze redirection

输入一张人脸图，输出经过调整过的人脸图，该人脸的视线方向发生了变换，其他信息不变

1.2 Gaze redirection 的应用

视频会议、图像和电影编辑、增强虚拟人的逼真度

1.3目前常见的方法与不足

主要介绍了一些2D方法，分为warping和生成式的方法

生成式法：Gan、 encoder-decoder、VAEs

不足：没有考虑到任务的三维性质(如视线方向的改变本质上是三维旋转问题)；眼球与其他的人脸特征难以解耦，很难保证其他特征能保持

1.4 本文提出的方法GazeNeRF

将眼球和其他人脸特征解耦开来，并对眼球部分进行刚性旋转

设计了一个two-stream MLPs，一个MLP处理眼睛，另一个处理其他特征

2.1Gaze redirection

warping的方法：生成不了新的像素，是对图像部分区域的变形

gan的方法：循环一致损失生成高质量图像、训练gaze estimator去计算gaze loss实现视线调整

encoder-decoder、VAEs：需要成对的sample,提出了旋转矩阵的方法调整视线，但由于其他特征耦合在其中，故直接旋转会破坏其他信息，是一种弱先验的使用

3.Method

3.1 HeadNeRF

gazeNeRF是在headNeRF基础上的工作，和headNeRF相似，为了得到不同的人脸，每一个点x的采样会受到人的特征信息的影响，即 $z_{id},z_{exp},z_{alb},z_{ill}$ ,分别代表人脸的形状、表情、纹理、光照情况特征。所求的NeRF模型就是作以下的变换：

其中 $z_{id},z_{exp},z_{alb},z_{ill}$ 的初始化是由一个3D morphable model(来自3d face from x: Learning face shape from diverse sources.)的人脸参数获得。

3.2 GazeNeRF

two-stream MLPs

GazeNeRF的输入中包含人脸的语义分割图，所以将一个完整的人脸提取出无眼的人脸和眼睛两个部分。

而后其设置了一个two-stream MLPs，其中一个MLP用来生成眼睛的特征图，另一个MLP生成除了眼睛部分之外的无眼脸的特征图。这两个MLPs的功能可以写成下式:

和HeadNeRF比加了一个输入g，g是原图中人眼的视线方向的特征，主要组成是定义了视线方向的yaw和pitch角度。此外这里的输入四个z初始化也是同HeadNeRF用3DMM获得。

三维的变形

通过上述结构可以先渲染出两个low-resolution的特征图， $F_{fw/o},F_{e}$ ,两个的形状为(64,64,258)，分别代表无眼脸特征和融合了视线方向的眼部特征。

对 $F_{e}$ 即融合了视线方向的眼部特征图，将其变形为(64,64,86,3),然后用一个旋转矩阵R乘以它，就得到了视线方向更改后的眼部特征图。这里的旋转矩阵R里的参数是我们想要最后生成的人脸的视线方向，和前文将的g是不同的。称旋转过后的眼部特征图为 $F_{e-rot}$ 。

对 $F_{fw/o}$ 会经过一个畸变操作，论文里对此没详细讲。

最后将处理过后的 $F_{e-rot}$ 和 $F_{fw/o}$ 进行一个max操作就能得到完整的人脸图 $F_{wf}$ 。

特征图融合与人脸图的渲染

至此就得到了三个特征图：旋转后的眼部特征图 $F_{e-rot}$ ，无眼脸特征图 $F_{fw/o}$ 以及完整人脸特征图 $F_{wf}$ ，将这三个特征图经过一个统一的下采样网络 $i_{mega}$ 就能得眼部图，无眼图和完整的人脸图。

Loss

使用了多个loss进行训练，分别为人脸重建损失，人脸感知损失，视线损失，与一个正则项损失。其中视线损失是利用了一个预训练的gaze estimator得到人眼的视线方向。

图有点乱，感兴趣可以去找paper看。

4.Experiments

指标Gaze,Head,LPIPS,ID。其中Gaze和Head指标是指用另外两个预训练的网络去评测眼睛视线方向和头部方向的和理想值的差异。

5.思考

这篇论文读下来思路还是比较好理解的，比较好的创新点是two-stream MLPs的架构，实现一种解耦效果。

全部评论 (0)

还没有任何评论哟~

GazeNeRF: 3D-Aware Gaze Redirection with Neural Radiance Fields

1.Introduction 1.1什么是Gazeredirection 输入一张人脸图，输出经过调整过的人脸图，该人脸的视线方向发生了变换，其他信息不变 1.2Gazeredirection的应用 ...

【每日论文】Latent Radiance Fields with 3D-aware 2D Representations

下载论文或阅读原文，请点击：每日论文摘要中文潜在3D重建技术在赋予3D语义理解和3D生成能力方面展现出巨大的潜力，它通过将2D特征提炼到3D空间来实现。然而，现有的方法在2D特征空间和3D表示之...

【3D分割】Segment Anything in 3D with Radiance Fields

论文链接：SegmentAnythingin3DwithRadianceFields 代码链接：GitHubJumpat/SegmentAnythingin3D:SegmentAnythingin3D...

【论文阅读】GRAF_ Generative Radiance Fields for 3D-Aware Image Synthesis

论文：<http://arxiv.org/abs/2007.02442 code：<https://github.com/autonomousvision/graf 摘要 2D生成对抗网络可以实现高分...

NeRF（Neural Radiance Fields）学习笔记

NeRF简要概括：为用一个MLP神经网络去隐式地学习一个静态3D场景。为了训练网络，针对一个静态场景，需要提供大量相机参数已知的图片。输入：5D向量函数，包括一个空间点的3D坐标位置，以及视角方向...

Baking Neural Radiance Fields for Real-Time View Synthesis

ICCV2021OralBakingNeuralRadianceFieldsforRealTimeViewSynthesis 代码地址snerg 目录摘要 1\.引言 2\.相关工作 ...

顶会论文种子 NeRF-Edit: 3D-Supervised Global Editing of Neural Radiance Fields

Title:NeRFEdit:3DSupervisedGlobalEditingofNeuralRadianceFields Abstract:NeuralRadianceFieldsNeRFshav...

CVPR 2023: BAD-NeRF: Bundle Adjusted Deblur Neural Radiance Fields

我们使用以下6个分类标准对本文的研究选题进行分析： 1\.问题域神经渲染：研究集中在从不同视点生成场景的新图像的任务上。目标是逼真的渲染，通常将场景表示为神经网络中的隐式函数。基于NeRF的方法主要...

CVPR 2023: DBARF: Deep Bundle-Adjusting Generalizable Neural Radiance Fields

我们使用以下6个分类标准来解释本文的研究主题： 1\.神经表示: 隐式:这种表示使用神经网络直接将空间中的3D点映射到其颜色和密度。网络充当“黑盒”函数，其内部工作原理无法直接解释。示例包括NeRF、...

NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

收录：eccv2020 领域：主要作用于神经场渲染以及视角合成项目主页链接：NeRF:NeuralRadianceFields 主要贡献： 1）引入了mlp预测像素颜色r以及volumedensit...

是否确定退出登录?

GazeNeRF: 3D-Aware Gaze Redirection with Neural Radiance Fields

1.Introduction

1.1什么是 Gaze redirection

1.2 Gaze redirection 的应用

1.3目前常见的方法与不足

1.4 本文提出的方法GazeNeRF

2.Related work

2.1Gaze redirection

3.Method

3.1 HeadNeRF

3.2 GazeNeRF

4.Experiments

5.思考

全部评论 (0)

相关文章推荐

GazeNeRF: 3D-Aware Gaze Redirection with Neural Radiance Fields

【每日论文】Latent Radiance Fields with 3D-aware 2D Representations

【3D分割】Segment Anything in 3D with Radiance Fields

【论文阅读】GRAF_ Generative Radiance Fields for 3D-Aware Image Synthesis

NeRF（Neural Radiance Fields）学习笔记

Baking Neural Radiance Fields for Real-Time View Synthesis

顶会论文种子 NeRF-Edit: 3D-Supervised Global Editing of Neural Radiance Fields

CVPR 2023: BAD-NeRF: Bundle Adjusted Deblur Neural Radiance Fields

CVPR 2023: DBARF: Deep Bundle-Adjusting Generalizable Neural Radiance Fields

NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis