论文笔记（1）：CVPR2019-Latent Filter Scaling for Multimodal Unsupervised Image-to-Image Translation

阅读量：

论文地址：arXiv:1812.09877
由于原文没有提供代码，并且发送邮件给作者后却无法回复（石沉），我自行实现了与之对应的部分，并未调试出原始效果。后续计划中将会更新相关内容。目前主要关注理论部分进行记录。

网络结构如图：

这篇论文的核心思想在于通过将latent code设计为卷积核模块的增强器，在遵循对抗网络的传统损失函数的同时，并未引入额外的代价项的情况下实现了多峰输出效果。同时该方法还意外实现了源域与目标域风格差异的有效分离（即风格间的解耦）。值得注意的是该方案并未对生成对抗网络框架进行任何改动而仅通过巧妙的设计实现了上述功能并且计算开销极低（无需额外引入自编码机制或重建任务相关的损失项）。此外该方法显著地抑制了基于图像到图像转换任务中常见的模式退化现象并在质量与转换优化方面具有更大的灵活性

主要目的是实现一个多目标的image2image翻译。通过提供原始图像x作为输入域X,我们旨在将其转换为目标域Y。为了生成多个输出,我们引入一个潜在编码z（从标准正态分布中随机采样）,该编码用于编码它们之间的差异特征。

在上文结构图中标注的z₁、z₂、z₃代表什么？

最终网络只使用了一个loss：

具体训练中，使用的是LSGAN的loss：

在实验过程中发现他采用了标签平滑技术，并将其应用于判别器设计中以优化其对真实样本的识别能力

为了将低维潜在向量映射至标量，在求解这一问题时

如上图所示，该系统基于CycleGAN进行了相应的优化。具体改进包括以下几点：首先仅包含单个生成器和单个判别器；其次通过从隐式分布中采样得到潜在编码z作为输入信号；第三步引入了一个可学习的一维全连接层用于将潜在编码转换为标量值，并将其与每一份特征图进行乘法操作。特别地，在经过ReLU激活函数并完成归一化处理前直接使用卷积层输出结果进行计算。

全部评论 (0)

还没有任何评论哟~

论文笔记（1）：CVPR2019-Latent Filter Scaling for Multimodal Unsupervised Image-to-Image Translation

论文地址：arXiv:1812.09877 原文没给代码，发了邮件给作者也石沉大海了，自己复现了一份代码，还没有调试出原文的效果，过段时间再来更新。这里先记录一下理论部分。

论文笔记-Multimodal Unsupervised Image-to-Image Translation

论文信息论文标题：MultimodalUnsupervisedImagetoImageTranslation 论文出处：ECCV2018 论文作者：XunHuang,MingYuLiu,SergeJ...

论文Multimodal Unsupervised Image-to-Image Translation

简介：无监督图像迁移网络是计算机视觉领域的一个技术难题，即给定一张源域图像，如何在没有其他图像样本的情况下，学习相应目标域图像的条件分布。当处理多维条件分布时，现有的方法是在过度简化的假设条件下，通...

Multimodal Unsupervised Image-to-Image Translation 论文小结

本文是自己阅读完MultimodalUnsupervisedImagetoImageTranslation后写的小结。因为自己理解不够，所以我选择保留原文中的一些英文单词而不是去翻译。

2018 LNCS之GAN（image transfer）：Multimodal Unsupervised Image-to-Image Translation

MultimodalUnsupervisedImagetoImageTranslation 开源：https://github.com/nvlabs/MUNIT 当前的问题及概述：无监督图像到图像的...

论文笔记-Contrastive Learning for Unpaired Image-to-Image Translation

论文信息标题：ContrastiveLearningforUnpairedImagetoImageTranslation 作者：TaesungPark,AlexeiA.Efros,RichardZh...

Few-Shot Unsupervised Image-to-Image Translation——ICCV2019论文解读

无监督的图像到图像翻译指的就是非配对的图像到图像的翻译。尽管它取得了一些成就，但是现在的方法需要在训练的时候用源域和目标域的图像一同训练，在这篇文章中，作者提出了一种基于小样本的无监督图像到图像翻译模...

《Few-Shot Unsupervised Image-to-Image Translation》FUNIT 阅读笔记

Arxiv链接 1概述英伟达大名鼎鼎的FUNIT，是对GAN的造假能力的进一步突破，传统的迁移生成模型（StarGAN，CycleGAN等），通常在源域和目标域都需要有足够的数据进行训练，学习较为充...

Unsupervised Attention-guided Image-to-Image Translation

这是NeurIPS2018一篇图像翻译的文章。目前的无监督图像到图像的翻译技术很难在不改变背景或场景中多个对象交互方式的情况下将注意力集中在改变的对象上去。这篇文章的解决思路是使用注意力导向来进行图像...

Multimodal Unsupervised Image-to-Image Translation多通道无监督图像翻译

前言：基于GAN的图像翻译方向一直很火爆，上次介绍了一个无法复现的SketchyGAN，非常失望。这次介绍一个来自英伟达研究院无监督GAN的图像翻译工作MUNIT，下一篇介绍同样是无监督图像翻译工作的...

是否确定退出登录?

论文笔记（1）：CVPR2019-Latent Filter Scaling for Multimodal Unsupervised Image-to-Image Translation

全部评论 (0)

相关文章推荐

论文笔记（1）：CVPR2019-Latent Filter Scaling for Multimodal Unsupervised Image-to-Image Translation

论文笔记-Multimodal Unsupervised Image-to-Image Translation

论文Multimodal Unsupervised Image-to-Image Translation

Multimodal Unsupervised Image-to-Image Translation 论文小结

2018 LNCS之GAN（image transfer）：Multimodal Unsupervised Image-to-Image Translation

论文笔记-Contrastive Learning for Unpaired Image-to-Image Translation

Few-Shot Unsupervised Image-to-Image Translation——ICCV2019论文解读

《Few-Shot Unsupervised Image-to-Image Translation》FUNIT 阅读笔记

Unsupervised Attention-guided Image-to-Image Translation

Multimodal Unsupervised Image-to-Image Translation多通道无监督图像翻译