GAN 生成对抗网络 - 朱婉妤的知识库

- Objective: 模型创造（生成）视觉内容 - Breadcrumb: # 概念阐释生成式对抗网络（Generative Adversarial Network），是通过两个[[CNN 卷积神经网络]]，生成器（generator）和鉴别器（discriminator）相互博弈，这一过程指的就是**对抗 adversarial**，相互优化来生成以假乱真的视觉图像，**最终模拟出可以堪比人类创造力的逼真视觉图像**。并且 GAN 是一种[[unsupervised learning 无监督学习]]，这代表 GNN 可以使用互联网上的无限数据，包括高分辨率的星系天文图片，或者富有情感的言语表达。该方法由[[伊恩·古德菲洛]]等人在 2014 年提出。 ## 工作流程 - 训练鉴别器（discriminator）： - 给鉴别器提供一些真实的样本（domain），训练鉴别器学习图片的特征和属性； - 然后再训练模型识别什么样的特征属性不属于这类图片； - 生成器：创建假的图片； - 将生成器生成的假图片送回给鉴别器，鉴别器判断图片是来自 domain 还是假的； - 两个神经网络相互博弈，输的一方要进行模型迭代； - 经过多轮迭代最终让生成器生成鉴别器无法识别的虚假图片； # 实例 - 预测视频的下一帧，将发生什么，用于监控系统； - 模拟人像合成； - 用低分辨率的图片生成高分辨率图片； # 相关内容比 GAN 更好的图像、视频生成器例如基于[[Transformer]]架构的 Sora 和 DALL-E。 ## 思考 AI 生成是对人类创造力的挑战，比如用演员参演过的电影创造出该演员的新作品。 # 参考资料 - [生成式对抗网络-维基百科](https://zh.wikipedia.org/wiki/生成对抗网络) - [what are GANS - IBM](https://readwise.io/reader/shared/01j0dk277ajnbnm64wefej0wkn) - 《深度学习》谢诺夫斯基 09