# 发散创新：用Python构建你的第一个生成对抗网络（GAN）实战项目在深度学习的浪潮中，**生成对抗网络（GAN）*

张开发

• 2026/4/17 18:41:37 • 15 分钟阅读

分享文章

发散创新用Python构建你的第一个生成对抗网络GAN实战项目在深度学习的浪潮中生成对抗网络GAN已成为图像生成、风格迁移和数据增强等任务的核心技术之一。它不仅是学术研究的热点更是工业界落地应用的重要工具。本文将带你从零开始搭建一个基于PyTorch的简易GAN模型通过完整的代码流程与可视化输出深入理解其训练机制并提供可直接运行的样例。 GAN核心思想 —— 一场“博弈”游戏GAN由两个神经网络组成生成器Generator负责“造假”试图生成逼真的假样本。判别器Discriminator负责“识破”判断输入是真实数据还是伪造数据。二者不断博弈最终达到纳什均衡状态生成器能骗过判别器而判别器再也分不清真假。关键点这不是监督学习而是无监督强化学习混合模式️ 环境准备数据加载确保你已安装必要的依赖pipinstalltorch torchvision matplotlib numpy我们使用MNIST手写数字数据集作为训练样本代码如下importtorchimporttorch.nnasnnimporttorch.optimasoptimfromtorchvisionimportdatasets,transformsimportmatplotlib.pyplotasplt# 数据预处理transformtransforms.Compose([transforms.ToTensor(),transforms.Normalize((0.5,),(0.5,))])datasetdatasets.MNIST(root./data,trainTrue,downloadTrue,transformtransform)dataloadertorch.utils.data.DataLoader(dataset,batch_size64,shuffleTrue) 构建生成器与判别器网络✅ 生成器结构以隐空间 z - 图像classGenerator(nn.Module):def__init__(self,input_dim100,output_dim784):super(Generator,self).__init__()self.modelnn.Sequential(nn.Linear(input_dim,256),nn.ReLU(),nn.Linear(256,512),nn.ReLU(),nn.Linear(512,output_dim),nn.Tanh()# 输出范围 [-1, 1])defforward(self,x):returnself.model(x).view(-1,1,28,28)### ✅ 判别器结构图像 → 概率pythonclassDiscriminator(nn.Module):def__init__(self,input_dim784):super(Discriminator,self).__init__()self.modelnn.Sequential(nn.Linear(input_dim,512),nn.LeakyReLU(0.2),nn.Linear(512,256),nn.LeakyReLU(0.2),nn.Linear(256,1),nn.Sigmoid())defforward(self,x):xx.view(-1,784)returnself.model(x)---## ⚙️ 训练逻辑详解重点每次迭代包含三个步骤1.训练判别器用真实图片假图片更新参数2.2.训练生成器让生成器尽量骗过判别器3.3.打印损失值并保存中间结果。 python devicetorch.device(cudaiftorch.cuda.is_available()elsecpu)GGenerator().to(device)DDiscriminator().to(device)optimizer_Goptim.Adam(G.parameters(),lr0.0002)optimizer_Doptim.Adam(D.parameters(),lr0.0002)criterionnn.BCELoss()forepochinrange(50):# 训练50轮forreal_images,_indataloader:batch_sizereal_images.size(0)# Real data label 1real_labelstorch.ones(batch_size,1).to(device)# Fake data label 0fake-labelstorch.zeros(batch_size,1).to(device)# train Discriminatoroptimizer_D.zero_grad()real-outputD(real_images.to(device))d-loss_realcriterion(real_output,real_labels)noisetorch.randn(batch_size,1000.to(device)fake_imagesG(noise)fake-outputD(fake_images.detach9))d_loss_fakecriterion9fake_output,fake_labels)d-lossd_loss-reald_loss_fake d-loss.backward()optimizer-d.step()# Train Generatoroptimizer_G.zero_grad()fake_outputD(fake-images)g_losscriterion(fake_output,real-labels)# 让判别器误以为是真实的g_loss.backward(0optimizer_G.step()if(epoch1)%100:print(fEpoch [{epoch1}/50], D loss: {d_loss.item():.4f], G Loss:{g_loss.item():.4f}0# 可视化生成效果withtorch.no_grad():fixed_noisetorch.randn(64,100).to(device)fake_samplesG(fixed_noise).cpu()plt.figure9figsize(8,8))foriinrange(64):plt.subplot(8,8,i1)plt.imshow(fake_samples[i][0],cmapgray)plt.axis(off)plt.tight_layout(0plt.savefig(fgan_output_epoch_{epoch1}.png)plt.show()---## ️ 输出示例训练第10轮、第30轮、第50轮|Epoch|效果描述||-------|----------||10|初期模糊但已有基本轮廓如圆形笔画 \|30|数字形状明显部分清晰可辨如“0”、“1”|\50|多数数字具备特征细节丰富接近真实分布|**技巧提示**如果发现训练不稳定loss震荡剧烈可以尝试调整学习率或加入梯度裁剪。---## 如何评估GAN质量—— 不只是看图除了肉眼观察还可以引入以下指标-**FID分数Fréchet Inception Distance**衡量生成图像与真实图像分布距离--**Inception ScoreIS**评估生成图像质量和多样性--**手动检查**是否存在模式崩溃所有生成都是同一类数字对于初学者建议先用可视化的手段建立信心再逐步引入定量指标。---## 进阶方向适合进阶读者如果你已经掌握了基础GAN下一步可以尝试-使用DCGAN改进结构卷积层替代全连接--引入Wasserstein LossWGAN提升稳定性--加入条件控制CGAN生成指定类别图像--应用于风格迁移、超分辨率重建等实际场景。---✅ 总结一句话**GAN不是魔法它是概率与优化的艺术 —— 用代码写出来的创造力。**现在你可以复制上面的完整代码在本地跑通整个流程亲手生成属于自己的“虚拟数字”。记住真正的AI能力不在于模型复杂度而在于你能用它解决什么问题。欢迎在评论区分享你的生成成果提醒训练过程中请合理监控GPU显存占用避免OOM错误若资源紧张可适当降低batch_size至32。

更多文章

前端开发 2026/4/18 5:50:31

PVE Tools终极指南：Proxmox VE高效管理脚本工具深度解析

PVE Tools终极指南：Proxmox VE高效管理脚本工具深度解析【免费下载链接】pvetools proxmox ve tools script(debian9 can use it).Including email, samba, NFS set zfs max ram, nested virtualization ,docker , pci passthrough etc. for english user,please l…

RTX 3060就能跑！Chandra OCR从安装到批量处理，完整教程来了 1. 为什么选择Chandra OCR 在日常工作中，我们经常遇到需要将纸质文档、扫描件或PDF转换为可编辑电子格式的需求。传统OCR工具往往存在以下痛点： 只能识别文字&#x…

张开发

前端开发 2026/4/17 22:29:04

西门子Robicon罗宾康LDZ10000432.00C单元控制板

在工业自动化领域，西门子Robicon家族的LDZ10000432.00C单元控制板堪称低调的"隐形劳模"，默默掌控着生产线的稳定运行。李工**180**6050**3853这款控制板参数硬核：额定电压适配三相AC 200-240V工业电网，输出频率最高达50…

张开发

# 发散创新：用Python构建你的第一个生成对抗网络（GAN）实战项目在深度学习的浪潮中，**生成对抗网络（GAN）*

最新文章

某宝登录密码加密逆向实战——从password2到st码的完整流程解析

Kubernetes Namespaces 详解：虚拟集群与资源隔离-Namespace01

【扣子Coze】新手入门教程，搭建智能体+工作流（全流程拆解）

sql执行替换更新，mysql替换指定内容

零基础Python小白速成指南

万象视界灵坛参数详解：图像预处理pipeline中Resize/Crop/Normalize配置

推荐文章

GPUStack 在华为昇腾 I A 服务器上的保姆级部署指南穆

用AI给显示器装上‘眼睛’：复旦博士的EyeReal方案，如何用三层LCD和RTX 4090实现桌面级裸眼3D？

现在不看就晚了：SITS2026结项报告中被删减的8页「AI临床偏差熔断机制」原始设计文档首次流出

如何构建高性能的消息队列系统

SITS2026圆桌闭门报告（仅限首批200名技术决策者）：AI原生研发的TCO重构公式与3个被90%CTO忽略的隐性回报维度

011、向量数据库入门：Embeddings原理与ChromaDB实战

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

PVE Tools终极指南：Proxmox VE高效管理脚本工具深度解析

大麦网抢票脚本终极指南：5步轻松搞定演唱会门票

小白也能玩转语音识别：Qwen3-ASR-1.7B开箱即用，实测效果惊艳

Kandinsky-5.0-I2V-Lite-5s开发入门：Anaconda虚拟环境配置与管理

别再死磕V4L2了！RV1126/RK3588摄像头偏绿？一个-a参数搞定ISP/AIQ色彩校正

终极Windows快捷键冲突检测指南：Hotkey Detective完整使用教程

HarmonyOS6 半年磨一剑 —— RcSearch 三方库插件禁用状态与高级控制机制深度解析

Uniapp+Vue3树形选择器

钙化染色方法不止茜素红，这三种同样值得关注

数据迁移避坑指南：如何用SQL在MySQL中保持雪花ID的连续性？

RTX 3060就能跑！Chandra OCR从安装到批量处理，完整教程来了

西门子Robicon罗宾康LDZ10000432.00C单元控制板

# 发散创新：用Python构建你的第一个生成对抗网络（GAN）实战项目在深度学习的浪潮中，**生成对抗网络（GAN）*

最新文章

某宝登录密码加密逆向实战——从password2到st码的完整流程解析

Kubernetes Namespaces 详解：虚拟集群与资源隔离-Namespace01

【扣子Coze】新手入门教程，搭建智能体+工作流（全流程拆解）

sql执行替换更新，mysql替换指定内容

零基础Python小白速成指南

万象视界灵坛参数详解：图像预处理pipeline中Resize/Crop/Normalize配置

推荐文章

GPUStack 在华为昇腾 I A 服务器上的保姆级部署指南穆

用AI给显示器装上‘眼睛’：复旦博士的EyeReal方案，如何用三层LCD和RTX 4090实现桌面级裸眼3D？

现在不看就晚了：SITS2026结项报告中被删减的8页「AI临床偏差熔断机制」原始设计文档首次流出

如何构建高性能的消息队列系统

SITS2026圆桌闭门报告（仅限首批200名技术决策者）：AI原生研发的TCO重构公式与3个被90%CTO忽略的隐性回报维度

011、向量数据库入门：Embeddings原理与ChromaDB实战

相关文章

探索Akagi：实时牌局分析与AI决策支持的麻将辅助系统

SEO 视频在不同行业的应用有何差异_SEO 视频的长度应该控制在什么范围内

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台 植物病虫害识别系统

生成式引擎优化（GEO）实战指南：从技术架构到行业落地

嵌入式开发调试宏与性能优化实战

LosslessCut：解锁无损视频编辑的5个专业技巧

分享文章

更多文章

基于YOLO+DeepSeek的农作物病虫害检测与环境监测一体化智能平台植物病虫害识别系统