MedGemma-X企业级落地：集成至PACS系统的API对接初步实践-深圳市維司達科技有限公司

MedGemma-X企业级落地：集成至PACS系统的API对接初步实践

1. 为什么需要把MedGemma-X连进PACS？

在放射科日常工作中，医生每天要处理几十甚至上百份影像——X光、CT、DR片堆在PACS系统里，等待被打开、观察、标注、写报告。传统流程中，AI辅助工具往往是个“孤岛”：你得先把影像从PACS导出，再手动拖进本地Gradio界面，等模型推理完，再把结果复制粘贴回报告系统。这个过程不仅打断工作流，还带来数据重复搬运、版本混乱、权限脱节等实际问题。

MedGemma-X不是另一个要单独打开的网页工具。它的定位很明确：成为PACS系统里“会思考”的一部分。当它真正以API服务形式嵌入到医院现有影像平台中，医生点开一张胸片时，旁边就能实时弹出结构化观察建议；输入一句“请重点评估左肺下叶结节边缘特征”，系统立刻返回带解剖定位的图文分析——整个过程不离开PACS界面，不切换窗口，不导出原始数据。

这背后的关键一步，就是API对接。本文不讲大模型原理，也不堆砌部署参数，而是聚焦一个真实场景：如何让MedGemma-X的推理能力，变成PACS后台可调用的标准HTTP接口。所有操作均基于已部署好的Gradio服务（http://0.0.0.0:7860），无需重装模型，不修改核心代码，只做轻量级封装与协议适配。

2. 理解当前服务的通信边界

2.1 Gradio默认交互模式的本质

MedGemma-X当前通过gradio_app.py启动了一个Web界面服务，监听在0.0.0.0:7860。表面看是图形界面，但底层所有功能都由Gradio的Blocks或Interface对象暴露为可调用函数。比如，阅片主逻辑通常封装在一个类似analyze_chest_xray(image, question)的Python函数中。

Gradio本身不直接提供RESTful API，但它支持两种关键扩展方式：

launch(inbrowser=False, server_name="0.0.0.0", server_port=7860)启动后，可通过/run端点发送POST请求调用组件；
更稳定的方式是绕过Gradio UI层，直接调用其后端函数，并用轻量Web框架（如FastAPI）重新包装成标准API。

我们选择后者——它更可控、更符合企业级集成要求，也避免Gradio内部路由和Session机制带来的不确定性。

2.2 当前环境可直接复用的资源

你不需要从零写模型加载逻辑。以下路径和配置已在你的环境中就绪，可直接引用：

模型加载脚本：/root/build/gradio_app.py中已定义好load_model()和inference_fn()函数；
预处理模块：/root/build/utils/preprocess.py提供DICOM转PIL、灰度归一化、尺寸对齐等函数；
GPU上下文：/opt/miniconda3/envs/torch27/环境已激活CUDA 0，无需额外初始化；
缓存路径：/root/build/cache/可用于临时存储上传的DICOM文件（注意权限：chown -R root:root /root/build/cache）。

这意味着，我们的API封装工作，核心是写一个独立的FastAPI服务，复用现有函数，只新增网络层和协议转换逻辑。

3. 构建标准化API服务：三步走方案

3.1 第一步：安装依赖并创建API入口

在当前环境（torch27）中安装FastAPI及Uvicorn：

conda activate torch27 pip install fastapi uvicorn python-multipart python-jose[cryptography] passlib

新建文件/root/build/api/main.py：

# /root/build/api/main.py from fastapi import FastAPI, File, UploadFile, Form, HTTPException from fastapi.responses import JSONResponse import os import tempfile from pathlib import Path # 复用原有逻辑 import sys sys.path.insert(0, "/root/build") from gradio_app import inference_fn # 直接导入推理函数 from utils.preprocess import dicom_to_pil # 导入DICOM处理工具 app = FastAPI( title="MedGemma-X PACS Integration API", description="Standard REST interface for MedGemma-X inference, designed for seamless PACS integration.", version="1.0.0" ) @app.post("/v1/analyze") async def analyze_image( file: UploadFile = File(..., description="DICOM or PNG/JPEG image file"), question: str = Form("", description="Optional clinical question in Chinese, e.g., '左肺上叶有无实变？'"), ): try: # 1. 保存上传文件到临时路径 suffix = Path(file.filename).suffix.lower() if suffix not in [".dcm", ".dicom", ".png", ".jpg", ".jpeg"]: raise HTTPException(status_code=400, detail="Unsupported file type. Only DICOM (.dcm), PNG, JPG accepted.") with tempfile.NamedTemporaryFile(delete=False, suffix=suffix) as tmp: content = await file.read() tmp.write(content) tmp_path = tmp.name # 2. 加载并预处理图像 if suffix in [".dcm", ".dicom"]: pil_img = dicom_to_pil(tmp_path) else: from PIL import Image pil_img = Image.open(tmp_path).convert("RGB") # 3. 调用MedGemma-X核心推理 result = inference_fn(pil_img, question) # 4. 清理临时文件 os.unlink(tmp_path) return JSONResponse({ "status": "success", "result": result, "input_filename": file.filename, "timestamp": result.get("timestamp", "") }) except Exception as e: # 记录错误到统一日志 with open("/root/build/logs/api_error.log", "a") as f: f.write(f"[{__import__('datetime').datetime.now()}] {str(e)}\n") raise HTTPException(status_code=500, detail=f"Inference failed: {str(e)}")

说明：该脚本不启动Gradio界面，只暴露/v1/analyze一个端点。它接收文件+问题，调用原生inference_fn，返回JSON结构化结果。所有异常捕获并记录，符合医疗系统可观测性要求。

3.2 第二步：启动独立API服务（不干扰原Gradio）

创建启动脚本/root/build/api/start_api.sh：

#!/bin/bash # /root/build/api/start_api.sh cd /root/build/api source /opt/miniconda3/etc/profile.d/conda.sh conda activate torch27 nohup uvicorn main:app --host 0.0.0.0 --port 8000 --workers 2 --log-level warning > /root/build/logs/api_access.log 2>&1 & echo $! > /root/build/api/api.pid echo "MedGemma-X API started on http://0.0.0.0:8000"

赋予执行权限并运行：

chmod +x /root/build/api/start_api.sh /root/build/api/start_api.sh

验证服务是否就绪：

curl -X GET http://localhost:8000/docs # 应返回Swagger UI页面 curl -X POST http://localhost:8000/v1/analyze \ -F "file=@/root/test_sample.dcm" \ -F "question=请描述心脏轮廓是否饱满"

成功响应示例（简化）：

{ "status": "success", "result": { "summary": "心脏轮廓饱满，心胸比约0.52，未见明显增大。", "findings": ["主动脉结不宽", "肺纹理清晰", "膈面光滑"], "confidence": 0.94 }, "input_filename": "test_sample.dcm" }

3.3 第三步：配置反向代理与安全接入（PACS侧准备）

PACS系统通常不允许直连内网非标准端口（如8000）。推荐使用Nginx做反向代理，并添加基础认证：

在/etc/nginx/conf.d/medgemma.conf中添加：

upstream medgemma_api { server 127.0.0.1:8000; } server { listen 443 ssl; server_name pacs-api.your-hospital.local; ssl_certificate /etc/ssl/certs/your-hospital.crt; ssl_certificate_key /etc/ssl/private/your-hospital.key; location /v1/ { proxy_pass http://medgemma_api/; proxy_set_header Host $host; proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; proxy_set_header X-Forwarded-Proto $scheme; # 强制Basic Auth（PACS系统需在Header中携带） auth_basic "MedGemma-X PACS Access"; auth_basic_user_file /etc/nginx/.medgemma_htpasswd; } }

生成账号（例如PACS系统调用账号）：

htpasswd -c /etc/nginx/.medgemma_htpasswd pacssystem

重启Nginx后，PACS后端即可通过如下地址调用：

https://pacs-api.your-hospital.local/v1/analyze

Header中需包含：

Authorization: Basic cGFjc3N5c3RlbTp<base64-encoded-password>
Content-Type: multipart/form-data

4. PACS集成实测：一次真实的调用链路

4.1 模拟PACS后端调用（Python示例）

假设你的PACS后端使用Python，以下是一个生产就绪的调用片段：

import requests import base64 def call_medgemma_pacs_integration(dicom_bytes: bytes, question: str = ""): url = "https://pacs-api.your-hospital.local/v1/analyze" auth_str = "pacsuser:your_secure_password" headers = { "Authorization": f"Basic {base64.b64encode(auth_str.encode()).decode()}" } files = {"file": ("study_12345.dcm", dicom_bytes, "application/dicom")} data = {"question": question} if question else {} try: response = requests.post( url, files=files, data=data, headers=headers, timeout=(10, 120) # 连接10秒，读取120秒（大图推理需时间） ) response.raise_for_status() return response.json() except requests.exceptions.Timeout: raise RuntimeError("MedGemma-X API timeout. Check GPU load and model cache.") except requests.exceptions.RequestException as e: raise RuntimeError(f"API call failed: {e}") # 使用示例 with open("/pacs/studies/12345/001.dcm", "rb") as f: result = call_medgemma_pacs_integration(f.read(), "请评估右肺中叶支气管充气征") print(result["result"]["summary"])

4.2 关键集成要点总结

项目	要求	说明
DICOM兼容性	必须支持`.dcm`原始文件	`dicom_to_pil()`已处理窗宽窗位、像素间距、方向信息，输出标准RGB PIL Image
超时设置	连接≤10s，读取≤120s	MedGemma-1.5-4b-it在A10 GPU上单图推理平均耗时45–75s，需预留缓冲
错误码映射	PACS需识别`400`(bad file)、`401`(auth fail)、`500`(model error)	所有异常均按HTTP标准返回，便于PACS日志分类
并发控制	建议`--workers 2`起始	单A10显存约24GB，bfloat16加载4B模型后余量约8GB，支持2路并发推理
审计日志	`/root/build/logs/api_access.log`和`api_error.log`	医疗系统必须留存完整调用链，含时间、IP、文件名、响应状态

5. 运维与长期可用性保障

5.1 服务自愈：Systemd守护双进程

你已有Gradio服务的systemd配置（/etc/systemd/system/gradio-app.service），现在为API服务新增一个：

创建/etc/systemd/system/medgemma-api.service：

[Unit] Description=MedGemma-X PACS API Service After=network.target [Service] Type=simple User=root WorkingDirectory=/root/build/api ExecStart=/opt/miniconda3/envs/torch27/bin/uvicorn main:app --host 0.0.0.0 --port 8000 --workers 2 --log-level warning Restart=always RestartSec=10 Environment="PATH=/opt/miniconda3/envs/torch27/bin" StandardOutput=append:/root/build/logs/api_access.log StandardError=append:/root/build/logs/api_error.log [Install] WantedBy=multi-user.target

启用并启动：

systemctl daemon-reload systemctl enable medgemma-api.service systemctl start medgemma-api.service

此时，两个服务完全解耦：

gradio-app.service→ 维护医生手动交互界面（7860端口）
medgemma-api.service→ 专供PACS程序调用（8000端口，经Nginx代理）

5.2 GPU资源隔离与监控

避免PACS高并发调用挤占Gradio界面响应。在/root/build/api/main.py开头加入显存预占控制：

import torch if torch.cuda.is_available(): # 预占1GB显存，防止后续推理因OOM失败 dummy = torch.empty(1024 * 1024 * 1024, dtype=torch.uint8, device="cuda") del dummy

同时，将nvidia-smi监控集成进健康检查端点：

@app.get("/healthz") def health_check(): gpu_info = {} if torch.cuda.is_available(): gpu_info = { "gpu_count": torch.cuda.device_count(), "current_gpu": torch.cuda.current_device(), "memory_allocated_mb": round(torch.cuda.memory_allocated() / 1024**2), "memory_reserved_mb": round(torch.cuda.memory_reserved() / 1024**2), } return { "status": "ok", "timestamp": __import__('datetime').datetime.now().isoformat(), "gpu": gpu_info }

PACS运维平台可定时轮询/healthz，实现自动告警。