盘锦市网站建设_网站建设公司_搜索功能_seo优化
2026/1/22 7:42:50 网站建设 项目流程

fft npainting lama华为云部署教程:鲲鹏架构适配说明

1. 项目背景与核心功能

你是不是也遇到过这样的问题:一张珍贵的照片里有个不想要的物体,或者截图上有水印遮挡了重要内容?现在,有一个简单又强大的工具可以帮你轻松解决——fft npainting lama图像修复系统

这个系统是由开发者“科哥”基于LaMa模型进行二次开发构建的,专门用于图像重绘、修复、移除物品等任务。它不仅能精准识别并填补被标注区域的内容,还能保持周围纹理、光照和色彩的一致性,生成自然无缝的结果。

更关键的是,这套系统已经完成了在华为云鲲鹏架构服务器上的适配部署,意味着你可以在国产化算力平台上稳定运行AI图像处理任务,无需依赖英伟达GPU环境。

1.1 能做什么?

  • 去除水印:无论是网页截图还是宣传图中的LOGO、文字水印,都能一键清除
  • 移除人物或物体:照片中多余的人、电线杆、垃圾桶,通通可以“抹掉”
  • 修复老照片瑕疵:划痕、污点、折痕自动补全,让旧照焕然一新
  • 智能填充背景:删除对象后,系统会根据上下文智能重建背景,毫无违和感

这不仅仅是一个开源项目的简单部署,而是真正面向实际应用的工程化落地版本。


2. 鲲鹏架构部署全流程

2.1 环境准备

本项目已在华为云鲲鹏弹性云服务器(ECS)上完成验证,推荐配置如下:

项目推荐配置
实例类型Kunpeng920 架构(如 s6.large.2)
操作系统openEuler 22.03 LTS SP3 aarch64
CPU2核及以上
内存8GB 及以上
系统盘50GB SATA 或更高
Python 版本3.9

注意:必须使用支持aarch64架构的镜像系统,x86_64镜像无法运行。

2.2 安装依赖与环境初始化

登录服务器后,依次执行以下命令:

# 更新系统包 sudo dnf update -y # 安装基础工具 sudo dnf install git wget unzip python3-pip -y # 创建工作目录并进入 mkdir -p /root/cv_fft_inpainting_lama && cd /root/cv_fft_inpainting_lama

由于鲲鹏平台不支持CUDA,我们采用CPU推理模式运行LaMa模型。虽然速度略慢于GPU,但完全可接受,且稳定性极高。

2.3 克隆项目代码

该项目为本地定制版本,已包含所有必要文件:

git clone https://gitee.com/kege_ai/fft-npainting-lama.git .

提示:原始LaMa项目基于PyTorch+GPU设计,此处已由“科哥”修改为兼容ARM架构的纯CPU推理版本,并优化了内存占用。

2.4 安装Python依赖

pip install torch==1.13.1+cpu torchvision==0.14.1+cpu --extra-index-url https://download.pytorch.org/whl/cpu pip install -r requirements.txt

部分库需使用源码安装或替换为aarch64兼容版本,例如:

  • opencv-python-headless替代标准OpenCV
  • 手动编译安装tqdm,Pillow,numpy等基础库

2.5 启动WebUI服务

执行启动脚本:

bash start_app.sh

看到如下输出表示成功:

===================================== ✓ WebUI已启动 访问地址: http://0.0.0.0:7860 本地访问: http://127.0.0.1:7860 按 Ctrl+C 停止服务 =====================================

此时可通过浏览器访问:http://<你的服务器IP>:7860


3. 使用操作指南

3.1 主界面功能布局

系统采用简洁直观的双栏式WebUI设计:

┌──────────────────────┬──────────────────────────────┐ │ 图像编辑区 │ 📷 修复结果 │ │ │ │ │ [上传/画笔标注] │ [修复后图像显示] │ │ │ │ │ [ 开始修复] │ 处理状态 │ │ [ 清除] │ [状态信息显示] │ └──────────────────────┴──────────────────────────────┘

左侧负责图像输入与区域标注,右侧实时展示修复结果。

3.2 四步完成图像修复

第一步:上传图像

支持三种方式:

  • 点击上传按钮选择文件
  • 直接将图片拖入编辑区
  • 复制图片后在页面粘贴(Ctrl+V)

支持格式:PNG、JPG、JPEG、WEBP

第二步:标注待修复区域

使用画笔工具涂抹需要移除的部分:

  • 白色区域 = 待修复区域
  • 可调节画笔大小,精细控制边缘
  • 若标错可用橡皮擦修正

建议略微扩大标注范围,避免遗漏边缘像素。

第三步:点击“开始修复”

点击 ** 开始修复** 按钮,系统将执行以下流程:

  1. 加载图像与mask
  2. 预处理数据(归一化、通道转换)
  3. 调用LaMa模型进行推理
  4. 后处理输出结果

处理时间参考:

  • 小图(<800px):约8秒
  • 中图(1000~1500px):15~25秒
  • 大图(>2000px):可能超过40秒
第四步:查看并保存结果

修复完成后,右侧将显示完整图像,状态栏提示保存路径:

完成!已保存至: /root/cv_fft_inpainting_lama/outputs/outputs_20260105142312.png

文件以时间戳命名,防止覆盖。


4. 核心技术适配要点

4.1 为什么能在鲲鹏上运行?

传统LaMa模型依赖PyTorch + CUDA,在ARM架构服务器上无法直接运行。本次部署的关键在于以下几个改造点:

改造项说明
移除CUDA依赖修改模型加载逻辑,强制使用CPU设备
轻量化推理流程减少中间缓存,降低内存峰值至<4GB
BGR转RGB自动处理解决OpenCV读取颜色通道错乱问题
静态图优化固定输入尺寸,提升推理效率
预编译依赖包提供适用于aarch64的wheel包集合

这些改动使得模型即使在无GPU环境下也能稳定运行,特别适合政务、教育、国企等对国产化平台有要求的场景。

4.2 性能表现实测

在鲲鹏s6.large.2实例(2核8G)上的测试结果如下:

图像尺寸平均处理时间内存占用输出质量
600×4007.8秒2.1GB高清无伪影
1200×80018.3秒3.4GB细节保留良好
1920×108036.5秒3.9GB轻微模糊,整体可用

建议日常使用控制在1500px以内分辨率,兼顾效率与效果。


5. 常见问题与解决方案

5.1 服务无法启动?

检查端口是否被占用:

lsof -ti:7860

若存在进程,终止后再试:

kill -9 $(lsof -ti:7860)

确认Python环境是否完整:

python3 -c "import torch, cv2, numpy, PIL"

如有报错,请重新安装缺失模块。

5.2 修复失败或黑屏?

常见原因及解决方法:

问题现象可能原因解决方案
黑图输出输入非RGB图像使用PNG格式上传
边缘明显痕迹标注太紧贴物体扩大标注范围10%~20%
处理卡住不动图像过大压缩至2000px以内
报错“no module”依赖未装全逐个安装requirements中列出的库

5.3 如何提高修复质量?

  • 优先使用PNG格式:避免JPG压缩带来的噪点干扰
  • 分区域多次修复:对于多个目标,逐一处理效果更好
  • 适当放大原图:高分辨率下细节重建能力更强
  • 手动调整mask边界:确保完全覆盖目标且不过度外扩

6. 应用场景实战案例

6.1 去除广告水印

原始图像:电商截图带有“扫码关注”二维码水印
操作步骤

  1. 上传截图
  2. 用大画笔完整覆盖二维码区域
  3. 点击修复

结果:背景纹理自然延续,无明显拼接痕迹,文字内容未受影响。

6.2 移除照片中路人

原始图像:旅游合影中有陌生人闯入画面
操作步骤

  1. 上传照片
  2. 精细标注路人轮廓(注意头发边缘)
  3. 分两次修复(身体+头部)

结果:天空与地面自动补全,画面连贯自然,看不出删改痕迹。

6.3 修复老照片划痕

原始图像:扫描的老照片存在多条纵向划痕
操作步骤

  1. 逐段标注划痕区域
  2. 小画笔精细操作
  3. 每修复一段保存一次

结果:划痕消失,皮肤质感和衣物纹理得以还原,怀旧感保留。


7. 总结

通过本次部署实践可以看出,fft npainting lama图像修复系统不仅能在鲲鹏架构上顺利运行,而且具备良好的实用性与稳定性。这对于推动AI技术在国产化软硬件生态中的落地具有重要意义。

这套系统的优势在于:

  • 完全适配ARM架构,摆脱对国外GPU的依赖
  • 操作简单,小白也能快速上手
  • 功能聚焦,专精于图像修复任务
  • 开源开放,支持二次开发扩展

无论你是想清理图片中的杂物,还是做数字档案修复,亦或是构建私有化图像处理服务,这套方案都值得一试。

未来还可进一步优化方向包括:

  • 引入ONNX Runtime加速推理
  • 添加批量处理功能
  • 支持API接口调用
  • 集成到企业内部系统中

获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询