开源图像修复模型fft npainting lama部署教程：免配置快速上手-深圳市維司達科技有限公司

开源图像修复模型FFT Inpainting LaMa部署教程：免配置快速上手

1. 为什么选FFT Inpainting LaMa？小白也能秒懂的修复逻辑

你有没有遇到过这些情况：一张风景照里突然闯入路人，想删掉又怕修得假；电商主图上水印太顽固，PS半天边缘还发虚；老照片有划痕，手动修补费眼又不自然……传统修图工具要么依赖专业技能，要么效果生硬。而FFT Inpainting LaMa不一样——它不是靠“复制粘贴”补洞，而是像人脑一样理解图像结构：看到断裂的栏杆，能推理出完整走向；面对模糊的云层，能生成符合光影逻辑的新纹理。

这个模型名字里的“FFT”指快速傅里叶变换，是它处理图像频域信息的核心技术——简单说，它不只看像素颜色，更分析图像的纹理节奏、边缘频率、明暗过渡规律。所以修复时不会出现“一块色块硬贴上去”的尴尬，而是让新内容自然融入原图肌理。科哥做的二次开发版更进一步：把复杂的Python环境、模型加载、API封装全打包进一个脚本，连Docker都不用装，真正实现“下载即用”。

重点来了：这不是给工程师看的论文复现，而是为设计师、运营、摄影师准备的傻瓜式工具。你不需要知道什么是U-Net，也不用调参，只要会画圈、点按钮，5分钟就能跑通全流程。下面我们就从零开始，不装任何依赖，直接启动。

2. 免配置部署：三步完成本地服务启动

别被“部署”吓到——这次真的不用配环境变量、不用装CUDA、不用查显卡驱动版本。整个过程就像打开一个APP，所有底层依赖都已预编译好，你只需要执行三个命令。

2.1 准备工作：确认基础条件

硬件要求：一台能跑Linux的机器（云服务器或本地Ubuntu/Debian均可），最低4GB内存，推荐带NVIDIA显卡（无显卡也能用CPU模式，速度稍慢）
系统要求：Ubuntu 20.04+ 或 Debian 11+（其他发行版需自行适配，本文以Ubuntu为例）
注意：无需安装Python、PyTorch、CUDA等——所有依赖已静态链接进可执行文件

2.2 一键拉取与启动

打开终端，依次执行以下命令（复制粘贴即可）：

# 创建工作目录并进入 mkdir -p ~/cv_fft_inpainting_lama && cd ~/cv_fft_inpainting_lama # 下载预编译镜像（含模型权重+WebUI+运行时） wget https://ucompshare-bin.s3-cn-wlcb.s3stor.compshare.cn/fft_inpainting_lama_v1.2.tar.gz # 解压（自动校验完整性） tar -xzf fft_inpainting_lama_v1.2.tar.gz # 赋予启动脚本权限 chmod +x start_app.sh

如果提示wget: command not found，先运行sudo apt update && sudo apt install wget -y安装wget。

2.3 启动WebUI服务

执行启动命令：

bash start_app.sh

你会看到类似这样的输出：

===================================== ✓ WebUI已启动 访问地址: http://0.0.0.0:7860 本地访问: http://127.0.0.1:7860 按 Ctrl+C 停止服务 =====================================

此时服务已在后台运行。打开浏览器，输入http://你的服务器IP:7860（如果是本地电脑，直接访问http://127.0.0.1:7860），就能看到清爽的界面——没有报错、没有红字、没有“waiting for model loading...”的漫长等待，因为模型已在启动时预热完毕。

3. 界面实操指南：从上传到下载，手把手带你走通第一张图

别急着点按钮，先花30秒看清界面布局。它不像Photoshop那样堆满工具栏，而是聚焦在“上传→标注→修复→下载”四个核心动作上，所有功能都为你省去多余步骤。

3.1 主界面分区解析

┌─────────────────────────────────────────────────────┐ │ 图像修复系统 │ │ webUI二次开发 by 科哥 | 微信：312088415 │ ├──────────────────────┬──────────────────────────────┤ │ │ │ │ 图像编辑区 │ 📷 修复结果 │ │ │ │ │ [图像上传/编辑] │ [修复后图像显示] │ │ │ │ │ [ 开始修复] │ 处理状态 │ │ [ 清除] │ [状态信息显示] │ └──────────────────────┴──────────────────────────────┘

左侧编辑区：你的操作台。这里只做两件事——放图、画圈。没有图层管理、没有通道混合，避免新手迷失。
右侧结果区：实时反馈区。修复一完成就立刻显示，不刷页面、不弹窗，结果和状态信息同屏可见。
底部状态栏：用大白话告诉你当前在做什么，比如“执行推理中…”比“Forward pass running…”友好十倍。

3.2 四步走通首图修复（附避坑提醒）

第一步：上传图像——三种方式任选其一

推荐拖拽上传：直接把手机拍的照片、截图、网页图片拖进虚线框，松手即上传（支持多图，但一次只处理一张）
点击上传：点虚线框内文字，调出系统文件选择器
剪贴板粘贴：截图后按Ctrl+V，连保存文件步骤都省了

❗ 注意：优先用PNG格式！JPG因压缩会产生色块，修复后可能边缘泛灰；WEBP兼容性稍差，建议转成PNG再传。

第二步：标注修复区域——画笔才是关键

这才是决定效果好坏的一步。记住口诀：“宁大勿小，宁白勿灰”。

画笔默认开启，直接在图上涂抹需要移除的部分（比如水印、电线、路人）
涂抹区域会显示为半透明白色，越白表示修复权重越高
用滑块调整画笔大小：小图用小笔（10px）精修边缘，大图用大笔（50px）快速覆盖

❗ 避坑：不要试图“精准描边”！LaMa模型擅长理解上下文，适当扩大标注范围（比如水印周围多涂2-3像素），系统会自动羽化融合，比紧贴边缘修得更自然。

第三步：点击“ 开始修复”——静待几秒

小图（<800px）约5秒出结果
中图（1000px左右）约12秒
大图（2000px）约25秒（后台已启用显存优化，不爆显存）

此时右侧结果区会实时显示进度条和状态文字，不用盯着转圈。

第四步：查看与下载——结果就在眼皮底下

修复图直接显示在右侧，支持鼠标滚轮缩放查看细节
状态栏明确告诉你：“完成！已保存至: /root/cv_fft_inpainting_lama/outputs/outputs_20260105142233.png”
文件已自动保存，无需手动点击“下载”——你随时可以用FTP、SCP或文件管理器取走

4. 这些技巧，让修复效果从“能用”升级到“惊艳”

很多用户第一次用觉得“还行”，第二次调下参数就直呼“这哪是AI，简直是透视眼”。关键在于理解模型的“思考习惯”，而不是把它当万能橡皮擦。

4.1 标注技巧：给模型提供清晰指令

复杂边缘处理：比如人物头发丝、树叶轮廓，先用小笔（10px）沿边缘轻描一圈，再用中笔（30px）填充内部。模型会把细线当作“引导线”，生成更锐利的过渡。
大面积物体移除：不要一次性涂满整块区域。分三次：先涂中心，再涂左半，最后涂右半。每次修复后下载，再上传新图继续——这样比单次大范围修复保留更多纹理细节。
文字去除秘诀：英文单词用小笔逐个字母涂；中文方块字可整体涂抹，但务必把字周围1-2像素空白也涂上，否则易残留笔画残影。

4.2 效果强化组合技

场景	操作	效果提升点
老照片划痕修复	先用小笔点涂划痕，再用“橡皮擦”轻轻擦掉划痕两端的毛刺	避免修复后出现“亮边”，更接近胶片质感
商品图去反光	在反光区域涂抹后，点击“清除”按钮重置，改用“大笔+低透明度”反复轻扫3次	模型会学习多次轻扫的语义，生成更柔和的漫反射效果
建筑图去脚手架	上传后先用“裁剪”工具切掉无关天空区域，再标注脚手架	减少无关信息干扰，模型更专注理解建筑结构

科哥实测发现：对同一张图连续修复3次，每次间隔5秒再操作，比单次长时运行效果更好——模型在短时记忆中能保持更一致的风格逻辑。

5. 真实场景实战：四类高频需求，附效果对比说明

理论不如实例直观。我们用真实用户提供的图片演示，不P图、不美化，只展示原始输入和原始输出。

5.1 场景一：电商主图去水印（效果对比）

输入：某品牌手机官网图，右下角有半透明“SAMPLE”水印
操作：用中笔（40px）涂抹水印及周围3像素区域
输出：水印完全消失，背景金属拉丝纹理连续自然，无色差
关键点：水印下方是高光区域，模型自动匹配了相邻像素的亮度梯度，没出现“一块灰斑”

5.2 场景二：旅游照去路人（效果对比）

输入：九寨沟瀑布全景照，前景有背对镜头的游客
操作：用大笔（60px）覆盖游客全身，额外涂抹其脚下岩石区域
输出：游客消失，瀑布水流自然延伸至岩石，水花飞溅方向与原图一致
关键点：模型识别出“瀑布”语义，生成的水流动态符合物理规律，不是静态填充

5.3 场景三：证件照去瑕疵（效果对比）

输入：身份证扫描件，人脸额头有油光反光点
操作：用小笔（8px）精准点涂反光点
输出：反光消失，皮肤纹理保留，毛孔细节清晰可见
关键点：未使用“磨皮”算法，而是基于局部肤色统计重建，避免“塑料脸”

5.4 场景四：海报图去LOGO（效果对比）

输入：活动海报，中央有主办方彩色LOGO
操作：分两次：先涂LOGO主体，修复后下载；再上传新图，用小笔精修LOGO边缘残留色块
输出：LOGO区域变为纯色渐变背景，与原海报设计风格统一
关键点：二次修复时，模型参考了第一次修复后的背景语义，生成更协调的渐变过渡

6. 常见问题速查：90%的问题，三句话内解决

遇到问题别慌，先对照这份清单。科哥团队已将用户反馈TOP10问题浓缩成极简答案。

Q1：点击“开始修复”没反应，状态栏一直显示“等待上传…”

A：检查是否真的上传成功——看左侧编辑区是否有缩略图。若无图，尝试拖拽重传；若有图但状态不变，按Ctrl+F5强制刷新页面缓存。

Q2：修复后图像发绿/偏色？

A：这是输入图含CMYK色彩空间导致的。用系统自带“图片查看器”另存为RGB模式的PNG再上传，或用命令行快速转换：convert input.jpg -colorspace sRGB output.png（需先sudo apt install imagemagick）。

Q3：大图修复卡在“初始化…”超过1分钟？

A：检查显存——运行nvidia-smi，若显存占用超90%，说明其他进程占满。临时关闭占用程序，或改用CPU模式：编辑start_app.sh，将--gpu参数改为--cpu。

Q4：橡皮擦擦不掉标注？

A：确认是否误点了“画笔”图标。工具栏中画笔（🖌）和橡皮擦（🧽）是独立按钮，点击切换。橡皮擦使用时，鼠标悬停处会显示“擦除中…”提示。

Q5：修复结果保存路径打不开？

A：文件确实在/root/cv_fft_inpainting_lama/outputs/，但Linux默认隐藏该目录。在文件管理器地址栏输入file:///root/cv_fft_inpainting_lama/outputs/直达，或用命令ls -lt ~/cv_fft_inpainting_lama/outputs/查看最新文件。

7. 进阶玩法：不写代码，也能玩转二次开发

科哥的版本预留了轻量级扩展接口，即使不懂Python，也能定制专属功能。

7.1 快速更换模型（无需重装）

项目目录下有models/文件夹，已预置两个版本：

lama_big.pth：高精度版，适合2K图，显存占用大
lama_fast.pth：速度版，1080P以内秒出图，显存友好

只需编辑config.yaml，修改model_path: "models/lama_fast.pth"，重启服务即生效。

7.2 自定义快捷键（改一行配置）

想用空格键代替“ 开始修复”？打开webui_config.json，找到"shortcut_keys"字段，添加：

"space": "start_inpaint"

保存后刷新页面，按空格即可触发修复。

7.3 批量处理入门（三行命令搞定）

虽然WebUI是单图交互，但底层支持命令行批量处理。例如批量修复文件夹内所有PNG：

cd ~/cv_fft_inpainting_lama python batch_inpaint.py --input_dir ./batch_input --output_dir ./batch_output --mask_dir ./batch_masks

batch_masks文件夹需存放对应命名的黑白掩码图（如photo1.png对应photo1_mask.png）。首次使用前，运行bash setup_batch.sh自动配置环境。

8. 总结：你离专业级图像修复，只差一次启动

回顾整个流程：从下载压缩包、解压、启动，到上传、标注、修复、下载，全程无需安装任何软件，不查一句文档，不碰一个配置文件。FFT Inpainting LaMa的强大，不在于它有多复杂的数学公式，而在于科哥团队把“理解图像”这件事，做成了普通人手指一点就能完成的动作。

它适合谁？

设计师：告别熬夜P图，10分钟处理20张商品图
运营：活动海报实时修改，领导要改LOGO，5秒重出一版
摄影师：老照片数字化修复，让祖辈影像重焕生机
开发者：开箱即用的API服务，集成到自己系统只需3行HTTP请求

技术终将隐形，体验才是王道。当你不再纠结“怎么部署”，而是专注“怎么修得更好”，这就是工具真正的成熟。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

开源图像修复模型fft npainting lama部署教程：免配置快速上手