- Objective: 模型创造(生成)视觉内容 - Breadcrumb: # 概念阐释 生成式对抗网络(Generative Adversarial Network),是通过两个[[CNN 卷积神经网络]],生成器(generator)和鉴别器(discriminator)相互博弈,这一过程指的就是**对抗 adversarial**,相互优化来生成以假乱真的视觉图像,**最终模拟出可以堪比人类创造力的逼真视觉图像**。并且 GAN 是一种[[unsupervised learning 无监督学习]],这代表 GNN 可以使用互联网上的无限数据,包括高分辨率的星系天文图片,或者富有情感的言语表达。该方法由[[伊恩·古德菲洛]]等人在 2014 年提出。 ## 工作流程 - 训练鉴别器(discriminator): - 给鉴别器提供一些真实的样本(domain),训练鉴别器学习图片的特征和属性; - 然后再训练模型识别什么样的特征属性不属于这类图片; - 生成器:创建假的图片; - 将生成器生成的假图片送回给鉴别器,鉴别器判断图片是来自 domain 还是假的; - 两个神经网络相互博弈,输的一方要进行模型迭代; - 经过多轮迭代最终让生成器生成鉴别器无法识别的虚假图片; # 实例 - 预测视频的下一帧,将发生什么,用于监控系统; - 模拟人像合成; - 用低分辨率的图片生成高分辨率图片; # 相关内容 比 GAN 更好的图像、视频生成器例如基于[[Transformer]]架构的 Sora 和 DALL-E。 ## 思考 AI 生成是对人类创造力的挑战,比如用演员参演过的电影创造出该演员的新作品。 # 参考资料 - [生成式对抗网络-维基百科](https://zh.wikipedia.org/wiki/生成对抗网络) - [what are GANS - IBM](https://readwise.io/reader/shared/01j0dk277ajnbnm64wefej0wkn) - 《深度学习》谢诺夫斯基 09