赛博炼丹新姿势！在NAS里造一个听劝的AI图片编辑网站-深圳市維司達科技有限公司

「NAS、键盘、路由器······年轻就要多折腾，我是爱折腾的熊猫，今天又给大家分享最近折腾的内容了，关注是对我最大的支持，阿里嘎多」

引言

大部分时候，AI都是被我们用来进行文字生成、图片生成等工作，但实际上基于AI我们也可以进行逆向操作，它不光会从零创造，更擅长对已有的文件“动手脚”，最典型的例子，就是目前各大手机厂商上的AI消除、去反光等功能。

目前咱们已知极空间的相册已经有了AI选片、照片去重、图片压缩以及对于老照片的修复、上色以及清晰度提升等功能，在相册功能这块，极空间确实是妥妥地走在了行业前沿。除此之外，通过Docker还可以把图像处理的玩法无限拓展，比如部署熊猫今天要介绍的AI-Image-Edit。

项目介绍

作为新晋项目，AI-Image-Edit目前的功能其实并不多，但它的思路很有意思。相较于传统的文生图以及图生图，AI-Image-Edit的主要功能还是集中在对图像的二次编辑上，感兴趣的可以去看看开源地址的介绍：https://github.com/chunxiuxiamo/ai-image-edit。

在首页，项目的左边有一处上传按钮，通过它可以上传图像，而右边则提供了图像的生成和编辑，因为要涉及到中文的输出，所以这里建议是使用nano-banana2。

至于nano-banana2的API，目前熊猫是没找到稳定的白嫖项目，想要使用暂时只能用半公益的站点，推荐上个人推荐老张API，在AI圈内也是比较知名的老牌API网站了，感兴趣的可以了解（非推广：https://api.laozhang.ai/register/?aff_code=rDFp）

除了gemini官方，也支持OpenAI接口的第三方模型，支持接口地址自定义。除此之外就是下方的图片尺寸与宽高比设置，最大支持4K的输出，不过测试4K下不支持流式传输，同时2K的输出时间要快一些，精度要求不高个人建议2K其实就够用了。

当我们需要改变一张图中的元素时，将其图片上传，随后通过画笔工具将需要修改的位置进行涂抹，最后在右边会得到编辑指令，AI会根据指令识别其中的区域，这时候就可以根据你的需求改变其中的一些元素，例如文字信息。

除了文字，也可以用于人物消除、AI扣图以及背景统一等等功能，其操作和原理其实和咱们日常手机上的相册AI相差不大，只不过因为基于Gemini3 Pro，所以它对于中文的支持更好。

项目部署

AI-Image-Edit并没有提供已经打包好的镜像供我们使用，不过作者提供了Dockerfile文件，所以你可以直接将项目下载下来之后自行构建，或者直接用熊猫构建好的容器镜像。

熊猫构建的镜像地址为：ghcr.io/panda-995/nano-banana-web:latest，针对这种非DockerHUB上的镜像，在进行镜像拉取一定记得带上站点的名称，随后通过极空间Docker仓库的自定义拉取去进行操作。

因为项目不存在环境变量以及文件存储的映射，所以我们下载好镜像之后直接在本地镜像中找到他，随后双击创建容器就行，只需要映射容器端口即可。或者直接用Compose进行拉取与容器创建。

version:'3.8'# Compose 文件版本，选择兼容主流 Docker 版本的 3.8services: nano-banana-web: image: ghcr.io/panda-995/nano-banana-web:latest container_name: nano-banana-web ports: -"8868:80"restart: always

最后通过极空间的远程访问就可以直接访问项目的首页了，项目并不具备鉴权，所以记得不要将其暴露到公网之下。

写在最后

将新兴的AI应用部署到自己的极空间NAS上，这本身就是一种乐趣，AI-Image-Edit虽然目前功能还在早期，但将新兴的AI应用部署到自己的极空间NAS上，这本身就是一种乐趣。

以上便是本次分享的全部内容了，如果你觉得还算有趣或者对你有所帮助，不妨点赞收藏，最后也希望能得到你的关注，咱们下期见！

Qwen2.5-7B知识图谱：结构化知识增强

Qwen2.5-7B知识图谱：结构化知识增强 1. 技术背景与核心价值 1.1 大模型演进中的知识瓶颈随着大语言模型（LLM）在自然语言理解、代码生成和多轮对话等任务中表现日益强大，传统“黑箱式”训练方式逐渐暴露出其局限性——缺乏对结…

李华

Qwen2.5-7B财务预测模型：基于文本数据的分析

Qwen2.5-7B财务预测模型：基于文本数据的分析 1. 引言：大语言模型在金融领域的潜力 1.1 财务预测的新范式传统财务预测依赖于结构化数据（如财报、股价、交易量）和统计建模方法（如ARIMA、GARCH）。然而&…

李华

2024大模型趋势入门必看：Qwen2.5-7B开源+弹性GPU部署实战指南

2024大模型趋势入门必看：Qwen2.5-7B开源弹性GPU部署实战指南 1. 引言：为什么 Qwen2.5-7B 值得关注？ 2024年，大语言模型（LLM）正从“参数竞赛”转向实用化落地与高效部署并重的新阶段。阿里云发布的 Qwen2.5…

李华

图解说明ArduPilot如何通过BLHeli实现精准油门响应

ArduPilot 如何通过 BLHeli 实现毫秒级油门响应？一文讲透底层逻辑你有没有遇到过这种情况：遥控杆轻轻一推，无人机却“慢半拍”才开始上升；悬停时轻微抖动，像喝醉了一样；高速转弯时动力跟不上，差…

李华

Qwen2.5-7B推理加速：SwiGLU激活函数优化实战

Qwen2.5-7B推理加速：SwiGLU激活函数优化实战 1. 引言：为何关注Qwen2.5-7B的推理性能？ 1.1 大模型推理的现实挑战随着大语言模型（LLM）在实际应用中的广泛部署，推理延迟和显存占用成为制约用户体验的关键…

李华

Qwen2.5-7B部署优化：GQA分组查询注意力实战配置指南

Qwen2.5-7B部署优化：GQA分组查询注意力实战配置指南 1. 引言：为何关注Qwen2.5-7B的GQA部署优化？ 随着大语言模型在实际业务场景中的广泛应用，推理效率与显存占用成为制约其落地的关键瓶颈。阿里云最新发布的 Qwen2.5-7B 模型&…

李华