生成对抗网络

阅读量：

生成对抗网络 GAN

模型

GAN由生成器和判别机构成, 需要同步训练两个组件, 其中利用噪声变量能合成假的数据样本. 判据则需能辨别输入图像究竟是来自真实数据集还是由合成模型制造出来的假图像, 合成模型的目标是尽力欺骗鉴別机（使鉴別机无法分辨图像来源）, 而鉴別机则努力识别图像的真实归属. 这是一个涉及双方博弈机制的问题.
为了研究生成模型对数据分布 $p_g$ 的学习能力, 定义输入噪声服从先验分布 $p_z(z)$ , 用符号 $G(z;\theta_g)$ 表示此生成模型.
判別机用于分类判断样本是否来自真实数据集或虚假图像, 记作 $D(x;\theta_d)$ .
基於上述组件与机制, 训練过程包括以下内容：
为了训练判别器D以区分生成器产生的样本与真实数据集中的样本。
同时在优化过程中也会训练生成器G使其能够最小化对应的损失函数 $\log(1 - D(G(z)))$ 。
损失函数被定义为 $\min_G\max_D V(D, G) = \mathbb{E}_{x \sim p_{data}(x)}[\log D(x)] + \mathbb{E}_{z \sim p_z(z)}[\log (1 - D(G(z)))]$ 。
2. 损失推导
2.1.1 最大似然估计
其中 $p_{data}(x)$ 表示数据分布。
我们的目标是最接近地逼近真实的数据分布 $p_{data}$ 。
生成模型由参数θ定义的概率分布 $p_G(x;θ)$ 需要尽可能地贴近真实的数据分布 $p_{data}$ 。

ML估计如下:

由上式可以看出，极大似然估计的本质

2.2.2 GAN
生成器G接受输入z并生成x
判别器D接收输入x并判断其是否来自真实数据的分布P_data(x)
损失函数：

\mathcal{L} = \mathbb{E}_{x\sim P_{data}(X)}[\log D(x)] + \mathbb{E}_{z\sim P_{Z}(Z)}[\log(1 - D(G(z)))]

深入分析一下，在基于判别器D的情况下：
当给定生成器G时，
公式 $\mathop{max}_DV(G,D)$ 表征了分布 $P_G$ 与分布 $P_{data}$ 之间的距离，

给定x，我们对 $l = P_{data}(x)logD(x)+P_G(x)log(1-D(x))$ 进行求导

可得：

代入 :

为了解决生成器D的参数优化问题，在训练过程中采用梯度下降算法。在实际训练过程中,基于一批采样样本进行数据处理

训练D时，采用交叉熵，最小化交叉熵

训练步骤
- for num of training iterations：
  - for k steps do

按照分布 $p_g(z)$ 生成 $m$ 个mini-batch的噪声样本集合 $\{z^{(1)},...,z^{(m)}\}$ ；
按照数据分布生成一批包含 $m$ 个样本的mini-batch集合 $\{x^{(1)},...,x^{(m)}\}$ ；
使用随机梯度上升算法更新参数D
- 从分布采样m个mini-batch 噪音样本
- 随机梯度下降更新生成器G

Wasserstein GAN
4.1 存在一些问题
该方法在训练过程中不够稳定，在实现判别器与生成器动态平衡方面存在挑战
该模型容易陷入collapse mode现象，在这种情况下生成样本缺乏多样性
关于JS散度的方法也存在问题：当真实分布与生成分布的重叠区域过小时或完全无重叠区域时，JS散度会接近常数值log2(1)，导致梯度消失；如果判别器过于优秀，则真实分布与生成分布完全无重叠区域；如果判别能力不足，则会导致生成器梯度计算出现偏差，在优化过程中可能偏离正确的方向；而当判别能力处于最佳状态时（既不能太好也不能太差），很难找到一个合适的平衡点来避免梯度消失的问题

4.2 Wasserstein距离

其中

将上式改成GAN

设计一个神经网络结构作为判别器D，在确保其输出值在该范围内变动的前提下控制其参数规模不超过设定上限。通过这种设计方法，在计算生成模型与真实数据之间的Wasserstein距离时能够实现对这一关键指标的最大化逼近。

WGAM做的是回归问题，尽可能拟合Wasserstein距离

4.3 改进Wasserstein距离
当一个函数Lipschitz连续时，则其梯度范数的模长不大于1：

近似表达W距离

实际上无需在整个分布中满足Lispschitz条件，在某些特定直线上即可满足这些要求；此外，在实践中也不应选择最大值，因为梯度过小可能会影响优化效果

全部评论 (0)

还没有任何评论哟~

PyTorch 生成对抗网络 01.生成对抗网络

1\.简介本教程通过一个例子来对DCGANs进行介绍。我们将会训练一个生成对抗网络（GAN）用于在展示了许多真正的名人的图片后产生新的名人。这里的大部分代码来自pytorch/examples中的d...

对抗生成网络_生成对抗网络 | 实验

上期我们介绍了生成对抗网络原理及训练过程同样地，我们依旧通过实验来巩固我们刚刚所学的知识点。本次实验是基于JupyerNotebook、AnacondaPython3.7与Keras环境。数据集是...

生成对抗网络和对抗神经网络_生成对抗网络简介

生成对抗网络和对抗神经网络如果您最近一直在关注人工智能（AI）新闻媒体，则可能听说过Google的顶级AI人物之一IanGoodfellow于三月份移居了Apple。Goodfellow在2017年...

从生成对抗网络到条件生成对抗网络

《从生成对抗网络到条件生成对抗网络》作者：禅与计算机程序设计艺术 1\.背景介绍 1.1深度学习的崛起与生成模型的兴起近年来，深度学习技术的快速发展彻底改变了人工智能领域。特别是在计算机视觉、自然...

生成对抗网络_生成式对抗网络1 - 基于遗传算法的生成对抗网络

本文章为生成式对抗网络学习笔记 EvolutionaryGenerativeAdversarialNetworks 生成对抗网络GAN是从复杂的真实数据中学习相关特征的一种重要的生成模型。生成对抗模型...

生成对抗网络

生成对抗网络GAN 1.模型 GAN由生成器与判别器组成，需要同时训练两者，生成器通过噪音变量生成伪造的图片数据，而判别器对于输入图片来源于数据集还是伪造的图片要进行区分，生称器要尽可能的欺骗判别器（...

生成对抗网络

前言本人对于深度学习算是小白一枚，之前有不懂的问题，时常会翻看大牛们的技术博客，看多了，自己心里也痒痒的，于是就有了把自己的学习和思考的结果写下来的想法。同时也希望能借此文章与深度学习的小白们共勉，...

生成对抗网络

1.前言机器学习可以分为两类模型，一种是判别模型（discriminationmodel），给定一个输入，模型通过判别输入的类别。另一种是生成模型（generativemodel），给定输入，通过模...

生成对抗网络

生成对抗网络GAN 1.什么是GAN GAN含义：生成对抗网络（GenerativeAdversarialNetworks），主要做目标判别，应用在图像分类、语义分割、目标检测。 GAN简述：GAN包...

生成对抗网络_SAGAN：自注意力生成对抗网络

原论文下载地址：SelfAttentionGenerativeAdversarialNetworks 该文章作者为：HanZhang GitHub代码实现：pytorch实现摘要部分：本文提出了S...

是否确定退出登录?

生成对抗网络

生成对抗网络 GAN

全部评论 (0)

相关文章推荐

PyTorch 生成对抗网络 01.生成对抗网络

对抗生成网络_生成对抗网络 | 实验

生成对抗网络和对抗神经网络_生成对抗网络简介

从生成对抗网络到条件生成对抗网络

生成对抗网络_生成式对抗网络1 - 基于遗传算法的生成对抗网络

生成对抗网络

生成对抗网络

生成对抗网络

生成对抗网络

生成对抗网络_SAGAN：自注意力生成对抗网络