news 2026/6/22 10:12:35

[智能体-493]:Coze 工作流:图文生成视频完整流程拆解

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
[智能体-493]:Coze 工作流:图文生成视频完整流程拆解

这是一套从主题输入→生成绘图提示词→生成参考图→生成分镜脚本→生成动态视频的线性自动化工作流,共 5 个节点串联执行,全程无分支,顺序执行。

一、节点顺序与数据流转总览

流程链路:开始 → 图片提示词大模型节点 → 图像生成节点 → 视频脚本生成大模型节点 → 视频生成节点 → 结束

1. 【开始】入口节点

  • 输入变量:
    • str_zhuti:文本主题(示例输入:"美女漫步街头"
    • image:可选上传原图素材
  • 作用:接收用户原始输入,向下游传递主题文本,作为整条工作流的数据源起点。

2. 【图片提示词】LLM 大模型节点(豆包 1.6 深度思考)

  • 输入:上游传来str_zhuti(主题文字)
  • 输出两个变量:
    1. str_tishici:适配 AI 绘图的专业正向提示词
    2. str_reasoning_content:生成提示词的思考过程
  • 逻辑:大模型根据用户主题,自动扩写画质、光影、构图、风格等专业绘图关键词,给下一阶段绘图使用。
  • 运行耗时:12s

3. 【图像生成】绘图节点(通用 - Pro 绘图模型)

  • 输入:上一步输出的str_tishici绘图提示词
  • 输出:
    1. data:生成后的图片二进制 / 图片链接(作为后续视频的参考底图)
    2. str_msg:绘图执行日志信息
  • 逻辑:AI 根据扩写好的提示词生成一张静态参考图,作为视频画面基底;界面自带「图片预览 / 保存图片」功能。
  • 运行耗时:7s

4. 【视频脚本生成】LLM 大模型节点(豆包 1.6 深度思考)

  • 输入:上一步绘图产出的data(参考图)+ 原始主题
  • 输出:
    1. str_jiaoben:完整视频分镜脚本(镜头运镜、时长、画面动作、镜头切换描述)
    2. str_reasoning_content:脚本生成推理过程
  • 逻辑:结合静态参考图画面内容,拆分多段动态镜头文案,指导视频生成模型做画面动态、运镜、节奏。
  • 运行耗时:19s

5. 【视频生成】视频生成节点(doubao-seedance-tie 动态视频模型)

  • 输入两个核心参数:
    1. data前面生成的静态参考图(参考图片)
    2. str_jiaoben:上一步产出的视频分镜脚本
  • 输出:
    1. video:最终生成的动态视频资源
    2. str_msg:视频生成日志
  • 逻辑:以静态图为基底,按脚本描述添加人物动作、镜头推拉、画面流动,生成短视频。
  • 运行耗时:23s

6. 【结束】输出节点

  • 输入:上游视频节点产出的video、主题等数据
  • 输出类型:返回变量,对外输出成品视频文件 / 链接,完成整条链路。

二、整套流程核心逻辑总结

  1. 文本扩图:用户简单主题 → AI 扩写专业绘图词 → 生成静态参考图
  2. 图生分镜:参考图 + 主题 → AI 拆解视频镜头脚本
  3. 图 + 脚本生视频:静态底图 + 镜头动作脚本 → 驱动视频模型生成动态短片
  4. 全链路自动化串联,无需人工干预每一步,输入一句主题即可全自动出成片。

三、变量传递对照表

表格

当前节点输入变量来源输出变量下游接收用途
开始用户输入str_zhuti、image提示词节点
图片提示词开始节点 str_zhutistr_tishici、reasoning_content图像生成节点绘图输入
图像生成提示词 str_tishicidata (图片)、str_msg脚本节点做画面参考
视频脚本生成图像节点 data 图片str_jiaoben (脚本)、reasoning_content视频生成节点运镜指令
视频生成data 图片 + str_jiaoben 脚本video 成品、str_msg结束节点对外返回
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/22 10:08:17

Moonlight TV终极指南:3步将LG电视变身高性能游戏大屏

Moonlight TV终极指南:3步将LG电视变身高性能游戏大屏 【免费下载链接】moonlight-tv Lightweight NVIDIA GameStream Client, for LG webOS TV and embedded devices like Raspberry Pi 项目地址: https://gitcode.com/gh_mirrors/mo/moonlight-tv Moonligh…

作者头像 李华
网站建设 2026/6/22 10:04:35

Go的Hello World:不只是入门,而是运行时与环境的完整校验

1. 为什么“Hello World”在Go里不是一句问候,而是一把钥匙刚接触Go语言的人,常以为fmt.Println("Hello, World!")只是教科书式的开场白——敲完回车,屏幕闪出一行字,任务就算完成。我带过十几期Go入门训练营&#xff0…

作者头像 李华
网站建设 2026/6/22 9:59:57

Navicat重置脚本:轻松实现macOS数据库工具的无限试用

Navicat重置脚本:轻松实现macOS数据库工具的无限试用 【免费下载链接】navicat_reset_mac navicat mac版无限重置试用期脚本 Navicat Mac Version Unlimited Trial Reset Script 项目地址: https://gitcode.com/gh_mirrors/na/navicat_reset_mac 还在为Navic…

作者头像 李华
网站建设 2026/6/22 9:57:50

Blender 3MF格式插件:轻松实现3D打印工作流的完美桥梁

Blender 3MF格式插件:轻松实现3D打印工作流的完美桥梁 【免费下载链接】Blender3mfFormat Blender add-on to import/export 3MF files 项目地址: https://gitcode.com/gh_mirrors/bl/Blender3mfFormat 想要在Blender中直接处理3D打印文件吗?Blen…

作者头像 李华
网站建设 2026/6/22 9:55:25

DeepSeek-V4 MoE架构解析:CSA+HCA路由与CSWAR显存优化

1. 这不是又一个“刷分型”大模型,而是架构思路上的代际切换 DeepSeek-V4 发布刚满两周,朋友圈和社区里已经刷过好几轮“新王登基”的标题党。但如果你真去跑过 inference、看过 trace、调过 batch size,就会发现一个很反直觉的事实&#xf…

作者头像 李华
网站建设 2026/6/22 9:53:17

Windows触控板三指拖拽:免费开源工具让你的工作效率翻倍

Windows触控板三指拖拽:免费开源工具让你的工作效率翻倍 【免费下载链接】ThreeFingersDragOnWindows Enables macOS-style three-finger dragging functionality on Windows Precision touchpads. 项目地址: https://gitcode.com/gh_mirrors/th/ThreeFingersDrag…

作者头像 李华