1 minute read

过去 AI 擅长处理大数据,但是对于生成类任务,像艺术创作,被认为是人类专属;GAN 的出现改变了这一现状;

1 应用方向

1.1 二维图像

主题 模型 说明
图像翻译 Pix2pix, PAN; CycleGAN, DiscoGAN 一幅图像转换为另一幅图像,即风格变换
超分辨率 SRGAN 主要关注中间层误差,避免生成图像缺乏纹理
运动去模糊 DeblurGAN  
图像修复/补全   还原图像中缺失的部分
着色   图像颜色转换
深度估计   depth prediction,根据单张图片估计出深度图
视角转换   view synthesis,生成物体在其他视角下的二维图片
物体检测 SeGAN, Perceptual GAN for small object detection 引入超分辨率,进而提高小目标检测效果
目标变换 GeneGAN, GP-GAN  
联合分布图像生成 Coupled GAN 使用权重共享,以学习到多个域的数据分布
文本转图片 Stack GAN, TAN-GAN  
人脸迁移 SD-GAN, SL-GAN, DR-GAN, AGEGAN  

GAN 在文本、语音领域应用较少的原因:

  • GAN 在优化的时候使用的是反向传播,对于文本,语音这种离散数据,GAN 没法直接跳到目标值,只能根据梯度一步步靠近;
  • 对于序列生成问题,每生成一个单词,我们就需要判断这个序列是否合理,可是 GAN 里面的判别器是没法做到的;除非我们针对每一个 step 都设置一个判别器,这显然不合理;
    为了解决这些问题,强化学习中的策略梯度下降(Policy gredient descent)被引入到 GAN 中应对序列生成问题;

1.2 三维图像

主题 模型 说明
三维重建   3D reconstruction,2D 转 3D

1.3 序列数据

主题 模型 说明
音乐生成 C-RNN-GAN, SeqGAN, ORGAN, WaveGAN, SpecGAN 使用了策略梯度下降
文本生成 RankGAN  
语音转换 VAW-GAN(VAE+WGAN) 编码器进行语音编码,解码器负责重建音色
视频生成 VideoGAN, Pose-GAN, MoCoGAN  
行为分析   通过观察场景,来预测即将要出现的动作;

1.4 其他

主题 模型 说明
半监督学习 SSL-GAN, CatGAN; Triple-GAN 生成的样本辅助分类器学习到数据空间
域适应 DANN, ARDA, CycleGAN, CyCADA, Unsupervised pixel-lecel domain adaptation 原域到目标域的迁移
持续学习 Deep generative replay 通过不断学习来解决多个任务
医学图像分割 DI2IN; SCAN; SegAN  
图片隐写 Steganography GAN, Secure steganography GAN 图片中写入信息

2 实际应用

功能 模型 数据集 Tensorflow Pytorch MXNet Caffe Keras Theano Torch
手写数字识别 DCGAN MNIST         jacobgil    
服装生成 Condition GAN Fashion-MNIST              
人脸生成 BEGAN CelebA carpedm20            
苹果变橘子、马变斑马 CycleGAN apple2orange xhujoy junyana         junyana-offical-lua
文本生成鸟 StackGAN birds Kuntal-G            
性别转换 DiscoGAN CelebA,facescrub   SKTBrain          
- StarGAN CelebA,facescrub   yunjey          
车转脸、包包变鞋子、包包涂鸦、鞋子涂鸦 同上 3D face,3D Car   同上          
涂鸦 iGAN             junyana  
风格转换 BicycleGAN     junyana          
运动去模糊 DeblurGAN   RaphaelMeudec       GOPRO    
换脸 deepfakes+GAN           shaoanlu    
音频合成 WaveGAN,SpecGAN   官方·chrisdonahue            
                   
                   
                   

-:代表同上


TOP

附录

A 参考资料

[1]. Jonathan Hui. GAN — Some cool applications of GANs[EB/OL]. https://medium.com/@jonathan_hui/gan-some-cool-applications-of-gans-4c9ecca35900. 2018-06-22/2019-04-09.
[2]. Minchul Shin. 精彩的GAN应用和示例列表[EB/OL]. https://www.ctolib.com/nashory-gans-awesome-applications.html. 2017-10-13/2019-04-09.

Categories: , ,

Updated:

Comments