news 2026/4/23 12:11:34

【ComfyUI API 自动化利器:comfyui_xy Python 库使用详解】

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【ComfyUI API 自动化利器:comfyui_xy Python 库使用详解】

项目地址:https://github.com/xy200303/ComfyUiApi

PyPI地址:https://pypi.org/project/comfyui-xy/

在 AIGC 领域,ComfyUI 凭借其强大的节点式工作流赢得了众多开发者的青睐。然而,当我们需要将 ComfyUI 集成到自己的应用中,或者进行批量化、自动化任务时,直接使用官方 API 可能会显得有些繁琐。

为了解决这个问题,我开发了一个轻量级的 Python 客户端库 ——comfyui_xy。它封装了 ComfyUI 的核心 API,让你能够像调用普通 Python 函数一样,轻松实现上传图片、修改工作流、排队任务以及获取生成结果。

本文将详细介绍comfyui_xy的安装与使用方法,带你快速上手 ComfyUI 自动化。


1. 安装

首先,通过 pip 安装该库:

pipinstallcomfyui_xy

2. 快速入门

2.1 准备工作:获取 API 格式工作流

在使用 API 之前,你需要获取 ComfyUI 的工作流 JSON。注意:这与平时保存的 JSON 不同。

  1. 打开 ComfyUI 网页界面。
  2. 点击菜单中的Settings(齿轮图标)。
  3. 勾选“Enable Dev mode Options”
  4. 回到菜单,点击“Save (API Format)”按钮,保存为workflow_api.json

2.2 最简示例:文生图

下面是一个简单的示例,展示如何加载工作流并生成图片。

importjsonimportrandomfromcomfyui_xyimportComfyUiClient# 1. 初始化客户端 (默认连接本地 http://127.0.0.1:8188)client=ComfyUiClient()# 2. 加载你导出的 API 格式工作流withopen("workflow_api.json","r",encoding="utf-8")asf:workflow=json.load(f)# 3. 动态修改参数# 假设 KSampler 是节点 "3",我们要修改它的 seedworkflow["3"]["inputs"]["seed"]=random.randint(1,1000000000)# 4. 执行工作流# process_workflow 会自动排队、等待执行完成、并下载结果print("正在执行任务...")results=client.process_workflow(workflow)# 5. 保存结果fori,resultinenumerate(results):print(f"生成文件:{result.filename}({result.file_type})")result.save(f"output_{i}.png")# 保存到本地ifresult.file_type=="image":result.show()# 如果是图片,直接弹出预览

3. 核心功能详解

3.1 连接远程服务器

如果你的 ComfyUI 部署在远程服务器(例如 AutoDL 或云服务器),支持 HTTPS:

# 连接远程 HTTPS 服务器client=ComfyUiClient(url="https://u12345.autodl.com:12345")# 或者普通的 HTTP 服务器# client = ComfyUiClient(url="http://192.168.1.100:8188")

3.2 图生图:上传图片与遮罩

在图生图(Img2Img)或重绘(Inpainting)任务中,我们需要先上传图片。

# 上传图片image_name=client.upload_image("test.jpg")print(f"图片已上传,服务器文件名为:{image_name}")# 上传遮罩mask_name=client.upload_mask("mask.png")# 将上传后的文件名填入工作流节点# 假设 LoadImage 节点 ID 为 "10"workflow["10"]["inputs"]["image"]=image_name

3.3 处理多种输出类型

ComfyUI 不仅生成图片,还可能生成视频(AnimateDiff)、音频等。comfyui_xy统一使用ComfyResponse对象处理这些结果。

results=client.process_workflow(workflow)forresultinresults:# result.data: 原始二进制数据# result.file_type: 'image', 'video', 'audio' 等ifresult.file_type=="video":result.save("output_video.mp4")elifresult.file_type=="image":result.save("output_image.png")

3.4 高级控制

库中还封装了一些常用的系统级操作:

  • 中断任务
    client.interrupt()
  • 查看队列
    queue_info=client.get_queue()print(f"排队中:{queue_info['queue_pending']}, 运行中:{queue_info['queue_running']}")
  • 获取历史记录
    history=client.get_history_all()
  • 查询节点信息
    # 获取 KSampler 的输入输出定义info=client.get_object_info("KSampler")

4. 总结

comfyui_xy旨在简化 Python 与 ComfyUI 的交互过程,让你无需处理复杂的 WebSocket 连接和 HTTP 请求细节。无论是构建自己的 AI 应用后端,还是编写自动化测试脚本,它都能助你一臂之力。

项目开源地址:https://github.com/xy200303/ComfyUiApi

如果你觉得好用,欢迎给个 Star!如果有任何问题,也欢迎在 Issues 中反馈。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 6:37:31

BGE-Large-Zh环境部署:CUDA自动检测+FP16精度优化完整指南

BGE-Large-Zh环境部署:CUDA自动检测FP16精度优化完整指南 1. 这不是普通向量工具,而是中文语义理解的“本地显微镜” 你有没有试过这样的场景:手头有一堆中文文档,想快速找出哪几段最匹配用户提问,但传统关键词搜索总…

作者头像 李华
网站建设 2026/4/18 22:28:20

OFA视觉蕴含模型应用场景:教育培训图文理解能力评估工具

OFA视觉蕴含模型应用场景:教育培训图文理解能力评估工具 1. 为什么需要图文理解能力评估工具 在教育培训领域,学生对图文信息的理解能力直接影响学习效果。比如看一张物理实验图,能否准确描述实验装置和过程;看到一幅历史场景画…

作者头像 李华
网站建设 2026/4/21 19:10:46

从RK3588到RK3399:跨平台Buildroot适配的实战技巧与避坑指南

从RK3588到RK3399:跨平台Buildroot适配的实战技巧与避坑指南 在嵌入式开发领域,Rockchip系列芯片因其出色的性价比和丰富的功能接口而广受欢迎。然而,当开发者需要在不同型号的Rockchip平台间迁移项目时,往往会遇到SDK适配的挑战。…

作者头像 李华
网站建设 2026/4/16 14:15:57

DASD-4B-Thinking完整指南:vLLM服务配置、API暴露、Chainlit前端对接

DASD-4B-Thinking完整指南:vLLM服务配置、API暴露、Chainlit前端对接 1. 模型初识:这不是普通的小参数模型 你可能见过不少40亿参数的模型,但DASD-4B-Thinking不一样。它不追求“能说会道”的泛化能力,而是把全部力气用在刀刃上…

作者头像 李华
网站建设 2026/4/16 17:11:23

GME多模态向量-Qwen2-VL-2B实战:WebUI界面操作+curl API调用双模式演示

GME多模态向量-Qwen2-VL-2B实战:WebUI界面操作curl API调用双模式演示 1. 什么是GME多模态向量-Qwen2-VL-2B GME多模态向量-Qwen2-VL-2B,不是另一个“能看图说话”的大模型,而是一个专注向量生成与跨模态检索的轻量级专业工具。它不生成长文…

作者头像 李华
网站建设 2026/4/23 5:42:45

DamoFD-0.5G轻量部署教程:适配Jetson Nano等边缘设备的CUDA优化方案

DamoFD-0.5G轻量部署教程:适配Jetson Nano等边缘设备的CUDA优化方案 你是不是也遇到过这样的问题:想在Jetson Nano、NX或Orin这类资源受限的边缘设备上跑人脸检测,但主流模型动辄2GB起步,显存直接爆掉,推理慢得像卡顿…

作者头像 李华