开源图像修复模型FFT Inpainting LaMa部署教程:免配置快速上手
1. 为什么选FFT Inpainting LaMa?小白也能秒懂的修复逻辑
你有没有遇到过这些情况:一张风景照里突然闯入路人,想删掉又怕修得假;电商主图上水印太顽固,PS半天边缘还发虚;老照片有划痕,手动修补费眼又不自然……传统修图工具要么依赖专业技能,要么效果生硬。而FFT Inpainting LaMa不一样——它不是靠“复制粘贴”补洞,而是像人脑一样理解图像结构:看到断裂的栏杆,能推理出完整走向;面对模糊的云层,能生成符合光影逻辑的新纹理。
这个模型名字里的“FFT”指快速傅里叶变换,是它处理图像频域信息的核心技术——简单说,它不只看像素颜色,更分析图像的纹理节奏、边缘频率、明暗过渡规律。所以修复时不会出现“一块色块硬贴上去”的尴尬,而是让新内容自然融入原图肌理。科哥做的二次开发版更进一步:把复杂的Python环境、模型加载、API封装全打包进一个脚本,连Docker都不用装,真正实现“下载即用”。
重点来了:这不是给工程师看的论文复现,而是为设计师、运营、摄影师准备的傻瓜式工具。你不需要知道什么是U-Net,也不用调参,只要会画圈、点按钮,5分钟就能跑通全流程。下面我们就从零开始,不装任何依赖,直接启动。
2. 免配置部署:三步完成本地服务启动
别被“部署”吓到——这次真的不用配环境变量、不用装CUDA、不用查显卡驱动版本。整个过程就像打开一个APP,所有底层依赖都已预编译好,你只需要执行三个命令。
2.1 准备工作:确认基础条件
- 硬件要求:一台能跑Linux的机器(云服务器或本地Ubuntu/Debian均可),最低4GB内存,推荐带NVIDIA显卡(无显卡也能用CPU模式,速度稍慢)
- 系统要求:Ubuntu 20.04+ 或 Debian 11+(其他发行版需自行适配,本文以Ubuntu为例)
- 注意:无需安装Python、PyTorch、CUDA等——所有依赖已静态链接进可执行文件
2.2 一键拉取与启动
打开终端,依次执行以下命令(复制粘贴即可):
# 创建工作目录并进入 mkdir -p ~/cv_fft_inpainting_lama && cd ~/cv_fft_inpainting_lama # 下载预编译镜像(含模型权重+WebUI+运行时) wget https://ucompshare-bin.s3-cn-wlcb.s3stor.compshare.cn/fft_inpainting_lama_v1.2.tar.gz # 解压(自动校验完整性) tar -xzf fft_inpainting_lama_v1.2.tar.gz # 赋予启动脚本权限 chmod +x start_app.sh如果提示
wget: command not found,先运行sudo apt update && sudo apt install wget -y安装wget。
2.3 启动WebUI服务
执行启动命令:
bash start_app.sh你会看到类似这样的输出:
===================================== ✓ WebUI已启动 访问地址: http://0.0.0.0:7860 本地访问: http://127.0.0.1:7860 按 Ctrl+C 停止服务 =====================================此时服务已在后台运行。打开浏览器,输入http://你的服务器IP:7860(如果是本地电脑,直接访问http://127.0.0.1:7860),就能看到清爽的界面——没有报错、没有红字、没有“waiting for model loading...”的漫长等待,因为模型已在启动时预热完毕。
3. 界面实操指南:从上传到下载,手把手带你走通第一张图
别急着点按钮,先花30秒看清界面布局。它不像Photoshop那样堆满工具栏,而是聚焦在“上传→标注→修复→下载”四个核心动作上,所有功能都为你省去多余步骤。
3.1 主界面分区解析
┌─────────────────────────────────────────────────────┐ │ 图像修复系统 │ │ webUI二次开发 by 科哥 | 微信:312088415 │ ├──────────────────────┬──────────────────────────────┤ │ │ │ │ 图像编辑区 │ 📷 修复结果 │ │ │ │ │ [图像上传/编辑] │ [修复后图像显示] │ │ │ │ │ [ 开始修复] │ 处理状态 │ │ [ 清除] │ [状态信息显示] │ └──────────────────────┴──────────────────────────────┘- 左侧编辑区:你的操作台。这里只做两件事——放图、画圈。没有图层管理、没有通道混合,避免新手迷失。
- 右侧结果区:实时反馈区。修复一完成就立刻显示,不刷页面、不弹窗,结果和状态信息同屏可见。
- 底部状态栏:用大白话告诉你当前在做什么,比如“执行推理中…”比“Forward pass running…”友好十倍。
3.2 四步走通首图修复(附避坑提醒)
第一步:上传图像——三种方式任选其一
- 推荐拖拽上传:直接把手机拍的照片、截图、网页图片拖进虚线框,松手即上传(支持多图,但一次只处理一张)
- 点击上传:点虚线框内文字,调出系统文件选择器
- 剪贴板粘贴:截图后按
Ctrl+V,连保存文件步骤都省了
❗ 注意:优先用PNG格式!JPG因压缩会产生色块,修复后可能边缘泛灰;WEBP兼容性稍差,建议转成PNG再传。
第二步:标注修复区域——画笔才是关键
这才是决定效果好坏的一步。记住口诀:“宁大勿小,宁白勿灰”。
- 画笔默认开启,直接在图上涂抹需要移除的部分(比如水印、电线、路人)
- 涂抹区域会显示为半透明白色,越白表示修复权重越高
- 用滑块调整画笔大小:小图用小笔(10px)精修边缘,大图用大笔(50px)快速覆盖
❗ 避坑:不要试图“精准描边”!LaMa模型擅长理解上下文,适当扩大标注范围(比如水印周围多涂2-3像素),系统会自动羽化融合,比紧贴边缘修得更自然。
第三步:点击“ 开始修复”——静待几秒
- 小图(<800px)约5秒出结果
- 中图(1000px左右)约12秒
- 大图(2000px)约25秒(后台已启用显存优化,不爆显存)
此时右侧结果区会实时显示进度条和状态文字,不用盯着转圈。
第四步:查看与下载——结果就在眼皮底下
- 修复图直接显示在右侧,支持鼠标滚轮缩放查看细节
- 状态栏明确告诉你:“完成!已保存至: /root/cv_fft_inpainting_lama/outputs/outputs_20260105142233.png”
- 文件已自动保存,无需手动点击“下载”——你随时可以用FTP、SCP或文件管理器取走
4. 这些技巧,让修复效果从“能用”升级到“惊艳”
很多用户第一次用觉得“还行”,第二次调下参数就直呼“这哪是AI,简直是透视眼”。关键在于理解模型的“思考习惯”,而不是把它当万能橡皮擦。
4.1 标注技巧:给模型提供清晰指令
- 复杂边缘处理:比如人物头发丝、树叶轮廓,先用小笔(10px)沿边缘轻描一圈,再用中笔(30px)填充内部。模型会把细线当作“引导线”,生成更锐利的过渡。
- 大面积物体移除:不要一次性涂满整块区域。分三次:先涂中心,再涂左半,最后涂右半。每次修复后下载,再上传新图继续——这样比单次大范围修复保留更多纹理细节。
- 文字去除秘诀:英文单词用小笔逐个字母涂;中文方块字可整体涂抹,但务必把字周围1-2像素空白也涂上,否则易残留笔画残影。
4.2 效果强化组合技
| 场景 | 操作 | 效果提升点 |
|---|---|---|
| 老照片划痕修复 | 先用小笔点涂划痕,再用“橡皮擦”轻轻擦掉划痕两端的毛刺 | 避免修复后出现“亮边”,更接近胶片质感 |
| 商品图去反光 | 在反光区域涂抹后,点击“清除”按钮重置,改用“大笔+低透明度”反复轻扫3次 | 模型会学习多次轻扫的语义,生成更柔和的漫反射效果 |
| 建筑图去脚手架 | 上传后先用“裁剪”工具切掉无关天空区域,再标注脚手架 | 减少无关信息干扰,模型更专注理解建筑结构 |
科哥实测发现:对同一张图连续修复3次,每次间隔5秒再操作,比单次长时运行效果更好——模型在短时记忆中能保持更一致的风格逻辑。
5. 真实场景实战:四类高频需求,附效果对比说明
理论不如实例直观。我们用真实用户提供的图片演示,不P图、不美化,只展示原始输入和原始输出。
5.1 场景一:电商主图去水印(效果对比)
- 输入:某品牌手机官网图,右下角有半透明“SAMPLE”水印
- 操作:用中笔(40px)涂抹水印及周围3像素区域
- 输出:水印完全消失,背景金属拉丝纹理连续自然,无色差
- 关键点:水印下方是高光区域,模型自动匹配了相邻像素的亮度梯度,没出现“一块灰斑”
5.2 场景二:旅游照去路人(效果对比)
- 输入:九寨沟瀑布全景照,前景有背对镜头的游客
- 操作:用大笔(60px)覆盖游客全身,额外涂抹其脚下岩石区域
- 输出:游客消失,瀑布水流自然延伸至岩石,水花飞溅方向与原图一致
- 关键点:模型识别出“瀑布”语义,生成的水流动态符合物理规律,不是静态填充
5.3 场景三:证件照去瑕疵(效果对比)
- 输入:身份证扫描件,人脸额头有油光反光点
- 操作:用小笔(8px)精准点涂反光点
- 输出:反光消失,皮肤纹理保留,毛孔细节清晰可见
- 关键点:未使用“磨皮”算法,而是基于局部肤色统计重建,避免“塑料脸”
5.4 场景四:海报图去LOGO(效果对比)
- 输入:活动海报,中央有主办方彩色LOGO
- 操作:分两次:先涂LOGO主体,修复后下载;再上传新图,用小笔精修LOGO边缘残留色块
- 输出:LOGO区域变为纯色渐变背景,与原海报设计风格统一
- 关键点:二次修复时,模型参考了第一次修复后的背景语义,生成更协调的渐变过渡
6. 常见问题速查:90%的问题,三句话内解决
遇到问题别慌,先对照这份清单。科哥团队已将用户反馈TOP10问题浓缩成极简答案。
Q1:点击“开始修复”没反应,状态栏一直显示“等待上传…”
A:检查是否真的上传成功——看左侧编辑区是否有缩略图。若无图,尝试拖拽重传;若有图但状态不变,按Ctrl+F5强制刷新页面缓存。
Q2:修复后图像发绿/偏色?
A:这是输入图含CMYK色彩空间导致的。用系统自带“图片查看器”另存为RGB模式的PNG再上传,或用命令行快速转换:convert input.jpg -colorspace sRGB output.png(需先sudo apt install imagemagick)。
Q3:大图修复卡在“初始化…”超过1分钟?
A:检查显存——运行nvidia-smi,若显存占用超90%,说明其他进程占满。临时关闭占用程序,或改用CPU模式:编辑start_app.sh,将--gpu参数改为--cpu。
Q4:橡皮擦擦不掉标注?
A:确认是否误点了“画笔”图标。工具栏中画笔(🖌)和橡皮擦(🧽)是独立按钮,点击切换。橡皮擦使用时,鼠标悬停处会显示“擦除中…”提示。
Q5:修复结果保存路径打不开?
A:文件确实在/root/cv_fft_inpainting_lama/outputs/,但Linux默认隐藏该目录。在文件管理器地址栏输入file:///root/cv_fft_inpainting_lama/outputs/直达,或用命令ls -lt ~/cv_fft_inpainting_lama/outputs/查看最新文件。
7. 进阶玩法:不写代码,也能玩转二次开发
科哥的版本预留了轻量级扩展接口,即使不懂Python,也能定制专属功能。
7.1 快速更换模型(无需重装)
项目目录下有models/文件夹,已预置两个版本:
lama_big.pth:高精度版,适合2K图,显存占用大lama_fast.pth:速度版,1080P以内秒出图,显存友好
只需编辑config.yaml,修改model_path: "models/lama_fast.pth",重启服务即生效。
7.2 自定义快捷键(改一行配置)
想用空格键代替“ 开始修复”?打开webui_config.json,找到"shortcut_keys"字段,添加:
"space": "start_inpaint"保存后刷新页面,按空格即可触发修复。
7.3 批量处理入门(三行命令搞定)
虽然WebUI是单图交互,但底层支持命令行批量处理。例如批量修复文件夹内所有PNG:
cd ~/cv_fft_inpainting_lama python batch_inpaint.py --input_dir ./batch_input --output_dir ./batch_output --mask_dir ./batch_masksbatch_masks文件夹需存放对应命名的黑白掩码图(如photo1.png对应photo1_mask.png)。首次使用前,运行bash setup_batch.sh自动配置环境。
8. 总结:你离专业级图像修复,只差一次启动
回顾整个流程:从下载压缩包、解压、启动,到上传、标注、修复、下载,全程无需安装任何软件,不查一句文档,不碰一个配置文件。FFT Inpainting LaMa的强大,不在于它有多复杂的数学公式,而在于科哥团队把“理解图像”这件事,做成了普通人手指一点就能完成的动作。
它适合谁?
- 设计师:告别熬夜P图,10分钟处理20张商品图
- 运营:活动海报实时修改,领导要改LOGO,5秒重出一版
- 摄影师:老照片数字化修复,让祖辈影像重焕生机
- 开发者:开箱即用的API服务,集成到自己系统只需3行HTTP请求
技术终将隐形,体验才是王道。当你不再纠结“怎么部署”,而是专注“怎么修得更好”,这就是工具真正的成熟。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。