Advertisement

【复现】StarGANv1复现Celeb-A与RaFD结果一览

阅读量:

该文本介绍了StarGAN模型的复现过程,包括环境配置、数据集使用、论文学习内容、实现结果以及代码细节。环境使用了CUDA-9.0、Python-3.5.4和tensorflow-gpu-1.9.0,但部分硬件不支持CUDA-9.0,需手动替换文件。数据集方面,Celeb-A易于获取,而RaFD需导师或论文第一作者申请。论文学习中,判别器用于鉴别真伪并来源领域。实现结果中,模型在Celeb-A和RaFD上表现良好,但因显卡问题(1050显卡)导致训练困难,改小了batchsize并调整了numworkers。代码部分未保存模型,参考了相关博客。下一步计划复现StarGANv2。

官方代码仓库:GitHub
文章:论文

环境:

CUDA-9.0版本的环境配置无需调整,但需注意的是,某些硬件不支持CUDA-9.0,具体操作步骤可参考他人的博客获取详细说明。

数据集

Celeb-A 人脸数据集
在该平台即可访问,无需会员即可访问该平台
该数据集的尺寸为178×218,实际读取时会被解析为178x178。

RaFD 人脸表情数据集
需经导师或具有出版物的第一作者申请,学生自身无法申请,建议寻求指导老师协助。数据集的尺寸为681×1024,具体操作流程包括:对原始数据集进行缩放裁剪处理,将其调整为256×256的大小,随后提取了正面和45°侧面的图像,其余角度的样本予以舍弃。

论文学习

判别器,鉴定是真/假,鉴别来自哪个domain。

实现结果

celeb-A
原图 ——黑头发 —— 金头发 —— 棕头发 —— 男女转化 —— 老少转化

celeb—A

RaFD
原图 —— 愤怒 —— 轻蔑 —— 厌恶 —— 开心 —— 中性

RaFD

由于是1050显卡,原代码中的batch_size设置为16时无法处理,我将其降低。而且,当StarGAN的batch_size增大时,训练速度会减缓,大约需要两天时间。随后,需要将num_workers设置为0。

训练中断就很闹心:pytoch保存模型

观察了一下结果,其中,胡子、帽子、背景等原始图片质量对最终结果的影响尤为显著。这也就难怪很多论文在选图时都偏好使用白底图片了。

代码阅读

原始代码似乎未保存模型,已增加相关操作。

下一步

StarGANv2复现

全部评论 (0)

还没有任何评论哟~