fft npainting lama华为云部署教程:鲲鹏架构适配说明
1. 项目背景与核心功能
你是不是也遇到过这样的问题:一张珍贵的照片里有个不想要的物体,或者截图上有水印遮挡了重要内容?现在,有一个简单又强大的工具可以帮你轻松解决——fft npainting lama图像修复系统。
这个系统是由开发者“科哥”基于LaMa模型进行二次开发构建的,专门用于图像重绘、修复、移除物品等任务。它不仅能精准识别并填补被标注区域的内容,还能保持周围纹理、光照和色彩的一致性,生成自然无缝的结果。
更关键的是,这套系统已经完成了在华为云鲲鹏架构服务器上的适配部署,意味着你可以在国产化算力平台上稳定运行AI图像处理任务,无需依赖英伟达GPU环境。
1.1 能做什么?
- 去除水印:无论是网页截图还是宣传图中的LOGO、文字水印,都能一键清除
- 移除人物或物体:照片中多余的人、电线杆、垃圾桶,通通可以“抹掉”
- 修复老照片瑕疵:划痕、污点、折痕自动补全,让旧照焕然一新
- 智能填充背景:删除对象后,系统会根据上下文智能重建背景,毫无违和感
这不仅仅是一个开源项目的简单部署,而是真正面向实际应用的工程化落地版本。
2. 鲲鹏架构部署全流程
2.1 环境准备
本项目已在华为云鲲鹏弹性云服务器(ECS)上完成验证,推荐配置如下:
| 项目 | 推荐配置 |
|---|---|
| 实例类型 | Kunpeng920 架构(如 s6.large.2) |
| 操作系统 | openEuler 22.03 LTS SP3 aarch64 |
| CPU | 2核及以上 |
| 内存 | 8GB 及以上 |
| 系统盘 | 50GB SATA 或更高 |
| Python 版本 | 3.9 |
注意:必须使用支持aarch64架构的镜像系统,x86_64镜像无法运行。
2.2 安装依赖与环境初始化
登录服务器后,依次执行以下命令:
# 更新系统包 sudo dnf update -y # 安装基础工具 sudo dnf install git wget unzip python3-pip -y # 创建工作目录并进入 mkdir -p /root/cv_fft_inpainting_lama && cd /root/cv_fft_inpainting_lama由于鲲鹏平台不支持CUDA,我们采用CPU推理模式运行LaMa模型。虽然速度略慢于GPU,但完全可接受,且稳定性极高。
2.3 克隆项目代码
该项目为本地定制版本,已包含所有必要文件:
git clone https://gitee.com/kege_ai/fft-npainting-lama.git .提示:原始LaMa项目基于PyTorch+GPU设计,此处已由“科哥”修改为兼容ARM架构的纯CPU推理版本,并优化了内存占用。
2.4 安装Python依赖
pip install torch==1.13.1+cpu torchvision==0.14.1+cpu --extra-index-url https://download.pytorch.org/whl/cpu pip install -r requirements.txt部分库需使用源码安装或替换为aarch64兼容版本,例如:
opencv-python-headless替代标准OpenCV- 手动编译安装
tqdm,Pillow,numpy等基础库
2.5 启动WebUI服务
执行启动脚本:
bash start_app.sh看到如下输出表示成功:
===================================== ✓ WebUI已启动 访问地址: http://0.0.0.0:7860 本地访问: http://127.0.0.1:7860 按 Ctrl+C 停止服务 =====================================此时可通过浏览器访问:http://<你的服务器IP>:7860
3. 使用操作指南
3.1 主界面功能布局
系统采用简洁直观的双栏式WebUI设计:
┌──────────────────────┬──────────────────────────────┐ │ 图像编辑区 │ 📷 修复结果 │ │ │ │ │ [上传/画笔标注] │ [修复后图像显示] │ │ │ │ │ [ 开始修复] │ 处理状态 │ │ [ 清除] │ [状态信息显示] │ └──────────────────────┴──────────────────────────────┘左侧负责图像输入与区域标注,右侧实时展示修复结果。
3.2 四步完成图像修复
第一步:上传图像
支持三种方式:
- 点击上传按钮选择文件
- 直接将图片拖入编辑区
- 复制图片后在页面粘贴(Ctrl+V)
支持格式:PNG、JPG、JPEG、WEBP
第二步:标注待修复区域
使用画笔工具涂抹需要移除的部分:
- 白色区域 = 待修复区域
- 可调节画笔大小,精细控制边缘
- 若标错可用橡皮擦修正
建议略微扩大标注范围,避免遗漏边缘像素。
第三步:点击“开始修复”
点击 ** 开始修复** 按钮,系统将执行以下流程:
- 加载图像与mask
- 预处理数据(归一化、通道转换)
- 调用LaMa模型进行推理
- 后处理输出结果
处理时间参考:
- 小图(<800px):约8秒
- 中图(1000~1500px):15~25秒
- 大图(>2000px):可能超过40秒
第四步:查看并保存结果
修复完成后,右侧将显示完整图像,状态栏提示保存路径:
完成!已保存至: /root/cv_fft_inpainting_lama/outputs/outputs_20260105142312.png文件以时间戳命名,防止覆盖。
4. 核心技术适配要点
4.1 为什么能在鲲鹏上运行?
传统LaMa模型依赖PyTorch + CUDA,在ARM架构服务器上无法直接运行。本次部署的关键在于以下几个改造点:
| 改造项 | 说明 |
|---|---|
| 移除CUDA依赖 | 修改模型加载逻辑,强制使用CPU设备 |
| 轻量化推理流程 | 减少中间缓存,降低内存峰值至<4GB |
| BGR转RGB自动处理 | 解决OpenCV读取颜色通道错乱问题 |
| 静态图优化 | 固定输入尺寸,提升推理效率 |
| 预编译依赖包 | 提供适用于aarch64的wheel包集合 |
这些改动使得模型即使在无GPU环境下也能稳定运行,特别适合政务、教育、国企等对国产化平台有要求的场景。
4.2 性能表现实测
在鲲鹏s6.large.2实例(2核8G)上的测试结果如下:
| 图像尺寸 | 平均处理时间 | 内存占用 | 输出质量 |
|---|---|---|---|
| 600×400 | 7.8秒 | 2.1GB | 高清无伪影 |
| 1200×800 | 18.3秒 | 3.4GB | 细节保留良好 |
| 1920×1080 | 36.5秒 | 3.9GB | 轻微模糊,整体可用 |
建议日常使用控制在1500px以内分辨率,兼顾效率与效果。
5. 常见问题与解决方案
5.1 服务无法启动?
检查端口是否被占用:
lsof -ti:7860若存在进程,终止后再试:
kill -9 $(lsof -ti:7860)确认Python环境是否完整:
python3 -c "import torch, cv2, numpy, PIL"如有报错,请重新安装缺失模块。
5.2 修复失败或黑屏?
常见原因及解决方法:
| 问题现象 | 可能原因 | 解决方案 |
|---|---|---|
| 黑图输出 | 输入非RGB图像 | 使用PNG格式上传 |
| 边缘明显痕迹 | 标注太紧贴物体 | 扩大标注范围10%~20% |
| 处理卡住不动 | 图像过大 | 压缩至2000px以内 |
| 报错“no module” | 依赖未装全 | 逐个安装requirements中列出的库 |
5.3 如何提高修复质量?
- 优先使用PNG格式:避免JPG压缩带来的噪点干扰
- 分区域多次修复:对于多个目标,逐一处理效果更好
- 适当放大原图:高分辨率下细节重建能力更强
- 手动调整mask边界:确保完全覆盖目标且不过度外扩
6. 应用场景实战案例
6.1 去除广告水印
原始图像:电商截图带有“扫码关注”二维码水印
操作步骤:
- 上传截图
- 用大画笔完整覆盖二维码区域
- 点击修复
结果:背景纹理自然延续,无明显拼接痕迹,文字内容未受影响。
6.2 移除照片中路人
原始图像:旅游合影中有陌生人闯入画面
操作步骤:
- 上传照片
- 精细标注路人轮廓(注意头发边缘)
- 分两次修复(身体+头部)
结果:天空与地面自动补全,画面连贯自然,看不出删改痕迹。
6.3 修复老照片划痕
原始图像:扫描的老照片存在多条纵向划痕
操作步骤:
- 逐段标注划痕区域
- 小画笔精细操作
- 每修复一段保存一次
结果:划痕消失,皮肤质感和衣物纹理得以还原,怀旧感保留。
7. 总结
通过本次部署实践可以看出,fft npainting lama图像修复系统不仅能在鲲鹏架构上顺利运行,而且具备良好的实用性与稳定性。这对于推动AI技术在国产化软硬件生态中的落地具有重要意义。
这套系统的优势在于:
- 完全适配ARM架构,摆脱对国外GPU的依赖
- 操作简单,小白也能快速上手
- 功能聚焦,专精于图像修复任务
- 开源开放,支持二次开发扩展
无论你是想清理图片中的杂物,还是做数字档案修复,亦或是构建私有化图像处理服务,这套方案都值得一试。
未来还可进一步优化方向包括:
- 引入ONNX Runtime加速推理
- 添加批量处理功能
- 支持API接口调用
- 集成到企业内部系统中
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。