- Objective: 模型创造(生成)视觉内容
- Breadcrumb:
# 概念阐释
生成式对抗网络(Generative Adversarial Network),是通过两个[[CNN 卷积神经网络]],生成器(generator)和鉴别器(discriminator)相互博弈,这一过程指的就是**对抗 adversarial**,相互优化来生成以假乱真的视觉图像,**最终模拟出可以堪比人类创造力的逼真视觉图像**。并且 GAN 是一种[[unsupervised learning 无监督学习]],这代表 GNN 可以使用互联网上的无限数据,包括高分辨率的星系天文图片,或者富有情感的言语表达。该方法由[[伊恩·古德菲洛]]等人在 2014 年提出。
## 工作流程
- 训练鉴别器(discriminator):
- 给鉴别器提供一些真实的样本(domain),训练鉴别器学习图片的特征和属性;
- 然后再训练模型识别什么样的特征属性不属于这类图片;
- 生成器:创建假的图片;
- 将生成器生成的假图片送回给鉴别器,鉴别器判断图片是来自 domain 还是假的;
- 两个神经网络相互博弈,输的一方要进行模型迭代;
- 经过多轮迭代最终让生成器生成鉴别器无法识别的虚假图片;
# 实例
- 预测视频的下一帧,将发生什么,用于监控系统;
- 模拟人像合成;
- 用低分辨率的图片生成高分辨率图片;
# 相关内容
比 GAN 更好的图像、视频生成器例如基于[[Transformer]]架构的 Sora 和 DALL-E。
## 思考
AI 生成是对人类创造力的挑战,比如用演员参演过的电影创造出该演员的新作品。
# 参考资料
- [生成式对抗网络-维基百科](https://zh.wikipedia.org/wiki/生成对抗网络)
- [what are GANS - IBM](https://readwise.io/reader/shared/01j0dk277ajnbnm64wefej0wkn)
- 《深度学习》谢诺夫斯基 09