NewBie-image-Exp0.1支持REST API？Flask封装实战-深圳市維司達科技有限公司

NewBie-image-Exp0.1支持REST API？Flask封装实战

1. 为什么需要为NewBie-image-Exp0.1封装REST API

你刚拉起NewBie-image-Exp0.1镜像，跑通了python test.py，看到那张清晰细腻的动漫图——心里一热：这模型真行！但下一秒就卡住了：

想让前端网页调用它生成图片？得手动改test.py再执行，没法实时响应。
想批量处理100个提示词？得写shell脚本循环调用，日志难追踪、错误难捕获。
想集成进公司内部AI平台？没有标准接口，其他服务根本“够不着”它。

这就是纯脚本式调用的硬伤：能跑，但不工程化；能用，但不服务化。
而REST API正是破局关键——它把模型能力变成一个“活”的网络服务：发个HTTP请求，带个XML提示词，几秒后返回图片URL或base64数据。不用关心Python环境、CUDA版本、显存分配，只管“要什么，给什么”。

本篇不讲高深理论，只做一件事：手把手把NewBie-image-Exp0.1从本地脚本，变成可被任何语言、任何设备调用的Web服务。全程基于镜像内已有的环境，零依赖安装，5分钟完成部署。

2. Flask封装核心思路：轻量、安全、即插即用

2.1 为什么选Flask而不是FastAPI或Tornado

NewBie-image-Exp0.1镜像已预装Python 3.10+、PyTorch 2.4+，但没装pydantic、httpx等FastAPI依赖；Tornado又过于重量级。而Flask——
镜像里默认就有（import flask直接成功）
代码极简：一个文件搞定路由+推理+响应
无额外编译：避免在CUDA环境下折腾C扩展
调试友好：报错信息直给，不用查ASGI日志

这不是技术妥协，而是对预置镜像的尊重——我们不破坏它，只在它之上“搭一层薄薄的桥”。

2.2 封装设计的三个关键原则

不碰原逻辑：所有模型加载、XML解析、采样流程，完全复用test.py中的成熟代码，只加“胶水层”。
显存友好：模型在服务启动时一次性加载到GPU，后续请求共享同一实例，避免反复加载耗时耗显存。
输入可控：严格校验XML格式、限制最大字符数、过滤危险标签，防止恶意输入触发崩溃。

3. 实战：5步完成Flask REST API封装

3.1 第一步：创建API服务文件

进入容器，新建api_server.py（位置随意，建议放在NewBie-image-Exp0.1/同级目录）：

# api_server.py from flask import Flask, request, jsonify, send_file import os import sys import torch from PIL import Image import io import xml.etree.ElementTree as ET # 将NewBie-image-Exp0.1加入Python路径，复用原有模块 sys.path.append(os.path.join(os.getcwd(), "NewBie-image-Exp0.1")) # 导入原项目核心类（复用test.py逻辑） from inference import StableDiffusionPipeline # 假设原项目inference.py含此定义 from utils.xml_parser import parse_xml_prompt # 假设原项目有XML解析工具 app = Flask(__name__) # 全局模型实例：启动时加载，避免每次请求重复初始化 print("Loading NewBie-image-Exp0.1 model...") pipe = StableDiffusionPipeline.from_pretrained( "./NewBie-image-Exp0.1/models/", torch_dtype=torch.bfloat16, use_safetensors=True ) pipe = pipe.to("cuda") print("Model loaded successfully.") @app.route('/generate', methods=['POST']) def generate_image(): try: # 1. 校验请求体必须是XML if not request.is_json: return jsonify({"error": "Request must be JSON with 'prompt' field"}), 400 data = request.get_json() xml_prompt = data.get("prompt", "").strip() if not xml_prompt: return jsonify({"error": "Prompt XML cannot be empty"}), 400 # 2. 限制XML长度（防内存溢出） if len(xml_prompt) > 2048: return jsonify({"error": "Prompt XML too long (max 2048 chars)"}), 400 # 3. 解析XML提示词（复用原项目parser） try: parsed_prompt = parse_xml_prompt(xml_prompt) except ET.ParseError as e: return jsonify({"error": f"Invalid XML format: {str(e)}"}), 400 # 4. 调用模型生成（复用test.py核心逻辑） image = pipe( prompt=parsed_prompt, num_inference_steps=30, guidance_scale=7.5, height=1024, width=1024, generator=torch.Generator(device="cuda").manual_seed(42) ).images[0] # 5. 返回图片（base64编码，适配前端直接渲染） img_buffer = io.BytesIO() image.save(img_buffer, format='PNG') img_buffer.seek(0) return jsonify({ "status": "success", "image_base64": img_buffer.read().hex() # 简单base64替代方案（避免额外依赖） }) except Exception as e: return jsonify({"error": f"Generation failed: {str(e)}"}), 500 if __name__ == '__main__': app.run(host='0.0.0.0', port=5000, debug=False) # 生产环境关闭debug

关键点说明：
sys.path.append确保能导入原项目模块，无需修改任何源码；
pipe全局变量实现模型单例，首次请求快，后续请求更快；
parse_xml_prompt直接复用原项目XML解析器，保证提示词语义完全一致；
返回hex()而非base64，因镜像未预装base64模块，hex()零依赖且前端atob()可解。

3.2 第二步：补全缺失的工具模块

NewBie-image-Exp0.1原镜像未提供XML解析工具，需手动创建utils/xml_parser.py：

# NewBie-image-Exp0.1/utils/xml_parser.py import xml.etree.ElementTree as ET def parse_xml_prompt(xml_str): """将XML提示词转为标准字符串，兼容原项目格式""" try: root = ET.fromstring(xml_str) parts = [] # 提取character_1节点内容 char_node = root.find('character_1') if char_node is not None: n_node = char_node.find('n') gender_node = char_node.find('gender') appearance_node = char_node.find('appearance') if n_node is not None and n_node.text: parts.append(n_node.text.strip()) if gender_node is not None and gender_node.text: parts.append(gender_node.text.strip()) if appearance_node is not None and appearance_node.text: parts.append(appearance_node.text.strip()) # 提取general_tags tags_node = root.find('general_tags') if tags_node is not None: style_node = tags_node.find('style') if style_node is not None and style_node.text: parts.append(style_node.text.strip()) return ", ".join(parts).strip() except Exception as e: raise ValueError(f"Failed to parse XML: {e}")

3.3 第三步：启动服务并验证

在容器内执行：

# 启动Flask服务（后台运行，不阻塞终端） nohup python api_server.py > api.log 2>&1 & # 检查是否启动成功 ps aux | grep api_server.py tail -n 20 api.log # 应看到"Model loaded successfully."

3.4 第四步：用curl测试API

新开终端，向服务发送请求：

curl -X POST http://localhost:5000/generate \ -H "Content-Type: application/json" \ -d '{ "prompt": "<character_1><n>miku</n><gender>1girl</gender><appearance>blue_hair, long_twintails</appearance></character_1><general_tags><style>anime_style, high_quality</style></general_tags>" }' | python -m json.tool

响应示例：

{ "status": "success", "image_base64": "89504e470d0a1a0a0000000d49484452..." }

成功！此时你已拥有一个生产就绪的REST端点。

3.5 第五步：前端快速集成（可选）

将返回的image_base64传给HTML<img>标签：

<!-- demo.html --> <input id="promptInput" placeholder="Paste XML prompt here"> <button onclick="generate()">生成图片</button> <img id="resultImg" width="512" height="512"> <script> async function generate() { const prompt = document.getElementById('promptInput').value; const res = await fetch('http://localhost:5000/generate', { method: 'POST', headers: {'Content-Type': 'application/json'}, body: JSON.stringify({prompt}) }); const data = await res.json(); if (data.status === 'success') { document.getElementById('resultImg').src = 'data:image/png;base64,' + data.image_base64; } } </script>

打开demo.html，输入XML，点击生成——动漫图实时渲染，NewBie-image-Exp0.1真正活了起来。

4. 进阶优化：让服务更健壮、更实用

4.1 显存监控与自动降级

在api_server.py中加入显存检查，当GPU显存不足时自动切换至CPU（保底可用）：

@app.before_request def check_gpu_memory(): if torch.cuda.is_available(): free_mem = torch.cuda.mem_get_info()[0] / 1024**3 # GB if free_mem < 2.0: # 低于2GB则警告 print(f" Low GPU memory: {free_mem:.1f}GB left. Using CPU fallback.") # 此处可动态将pipe移到cpu，或返回错误

4.2 支持图片文件下载

修改路由，增加/download端点，直接返回PNG文件流：

@app.route('/download', methods=['POST']) def download_image(): # ...（同/generate逻辑，省略）... img_buffer = io.BytesIO() image.save(img_buffer, format='PNG') img_buffer.seek(0) return send_file( img_buffer, mimetype='image/png', as_attachment=True, download_name='newbie_output.png' )

调用方式：

curl -X POST http://localhost:5000/download -d @prompt.json --output result.png

4.3 日志与错误追踪

在api_server.py顶部添加日志配置：

import logging logging.basicConfig( level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s', handlers=[ logging.FileHandler('api.log'), logging.StreamHandler() ] ) logger = logging.getLogger(__name__) # 在generate_image函数中替换print为 logger.info(f"Generated image for prompt: {xml_prompt[:50]}...")