开源绘图新选择：Excalidraw结合AI实现自然语言转流程图-深圳市維司達科技有限公司

开源绘图新选择：Excalidraw结合AI实现自然语言转流程图

在远程协作成为常态的今天，团队沟通中最常见的场景之一，可能就是“我有个想法，但说不清楚”——尤其是面对复杂系统架构或业务流程时。传统的绘图工具虽然功能齐全，但往往需要用户花费大量时间拖拽、对齐、调整样式，真正用于思考的时间却被压缩到了最低。

有没有一种方式，能让人直接“说出来”，就能“画出来”？

答案是肯定的。近年来，Excalidraw这款以手绘风格著称的开源白板工具，正悄然改变着我们对可视化表达的认知。更令人兴奋的是，当它与大语言模型（LLM）相结合后，已经实现了从一句话描述自动生成流程图的能力。这不是未来设想，而是现在就可以用上的生产力跃迁。

为什么是 Excalidraw？

Excalidraw 的核心魅力在于它的“不完美”。它刻意模仿真实纸笔的手绘线条，让图形看起来像是随手画出来的草图。这种设计看似简单，实则深谙心理学：它降低了人们对“画得不好”的焦虑感，鼓励快速表达和迭代。

技术上，它是一个基于 Web 的虚拟白板应用，使用 React 和 Canvas 构建，完全运行在浏览器中。所有元素——矩形、箭头、文本框——都被序列化为 JSON 对象，支持本地存储、实时同步和多端协作。你可以把它嵌入自己的产品中，也可以作为独立服务部署。

更重要的是，它是开源的。这意味着开发者可以自由定制、扩展功能，甚至将其集成到笔记系统（如 Obsidian）、项目管理平台（如 Notion 插件）或其他内部工具链中。

import { Excalidraw } from "@excalidraw/excalidraw"; function WhiteboardApp() { return ( <div style={{ height: "100vh" }}> <Excalidraw initialData={{ appState: { theme: "dark", viewBackgroundColor: "#fff", }, }} onPointerUpdate={(payload) => { console.log("Pointer moved:", payload); }} onChange={(elements, appState) => { localStorage.setItem( "excalidraw-state", JSON.stringify({ elements, appState }) ); }} /> </div> ); }

上面这段代码展示了如何在 React 应用中嵌入 Excalidraw。整个过程就像引入一个普通组件一样简单。onChange回调可用于自动保存状态，而onPointerUpdate则能实现协同编辑中的光标追踪。这一切都封装好了，你不需要关心底层 Canvas 的绘制逻辑。

AI 如何把“话”变成“图”？

如果说 Excalidraw 解决了“怎么画得轻松”，那么 AI 要解决的就是“怎么不用画”。

设想这样一个场景：你在开一场产品评审会，口头描述了一个用户注册流程：“先输入手机号，然后点击获取验证码，后台校验通过后跳转到设置密码页。” 如果按照传统方式，你需要会后手动打开绘图软件，一个个添加节点、连线、标注……但现在，只需要把这些话复制粘贴进一个输入框，几秒钟后，一张结构清晰的流程图就出现在画布上了。

这背后的技术链条其实并不复杂，但非常巧妙：

输入解析：用户在前端输入自然语言；
语义理解：请求发送至后端 AI 服务（如 GPT-4 或本地部署的 Llama 3），模型识别出关键实体（节点名称）、关系（顺序、条件分支）、图类型（流程图、架构图等）；
结构生成：输出标准 JSON 格式的图表数据，包含每个元素的位置、标签、连接关系；
布局计算：前端根据结构调用 DAG 布局算法进行智能排布，避免重叠和混乱；
渲染展示：调用 Excalidraw API 将数据注入画布，立即呈现结果。

整个过程实现了“意图 → 结构 → 可视化”的闭环转化。最关键的一环，其实是提示工程（Prompt Engineering）。

比如，我们可以这样构造 prompt：

你是一个专业的技术绘图助手，请根据以下描述生成 Excalidraw 兼容的 JSON 格式图表：
- 图类型：系统架构图
- 组件：前端 React 应用、Node.js 网关、MySQL 数据库、Redis 缓存
- 连接关系：前端 → 网关 → 数据库；网关同时访问 Redis
- 要求：使用矩形表示服务，圆角矩形表示数据库，箭头标明流向

通过明确指定格式和样式要求，可以显著提升生成准确率，减少后期人工修正的工作量。

下面是服务端处理的核心逻辑示例：

from fastapi import FastAPI from pydantic import BaseModel import openai app = FastAPI() class DiagramRequest(BaseModel): description: str diagram_type: str = "flowchart" @app.post("/generate-diagram") async def generate_diagram(req: DiagramRequest): prompt = f""" 将以下描述转换为 Excalidraw 可用的 JSON 格式图表结构。 要求： - 每个元素包含：type, x, y, width, height, label - 元素间连接用 {{fromId, toId}} 表示 - 使用简洁布局，避免重叠 描述：{req.description} 类型：{req.diagram_type} """ response = openai.ChatCompletion.create( model="gpt-4-turbo", messages=[{"role": "user", "content": prompt}], temperature=0.3 ) raw_output = response.choices[0].message.content return {"elements": parse_to_excalidraw_format(raw_output)}

这个 API 接收自然语言输入，调用 LLM 生成结构化数据，并返回给前端。前端再通过updateScene方法将结果加载到画布：

const excalidrawAPI = await getExcalidrawInstance(); excalidrawAPI.updateScene({ elements: aiGeneratedElements, });

值得注意的是，在生产环境中，建议对返回结果做严格校验和清洗，防止非法坐标或字段缺失导致渲染异常。对于敏感业务场景，还可采用私有化部署模型（如 Ollama + Llama 3）来保障数据安全。

实际应用场景：不只是“画图”

这项能力带来的价值远不止节省几分钟绘图时间。它正在重塑多个工作流环节。

1. 快速原型设计

产品经理在头脑风暴时，可以直接口述流程，AI 实时生成草图，团队成员即时讨论修改。比起“我说你记再回头画”，效率提升数倍。

2. 技术方案可视化

工程师写完一段设计文档，只需选中关键段落，一键生成架构图。无论是 PRD 附件还是会议材料，都能迅速产出高质量配图。

3. 新人入职引导

复杂的微服务调用链，原本需要资深员工花半小时讲解。现在可以把接口注释或日志路径转化为流程图，新人自己看图就能理解大概逻辑。

4. 跨部门沟通

非技术人员（如运营、市场）往往难以理解技术术语。一张由 AI 生成的流程图，能有效降低认知门槛，促进共识达成。

特别是在敏捷开发、DevOps、SRE 等强调快速反馈的团队中，这种“即想即现”的能力显得尤为珍贵。

架构设计的关键考量

在一个典型的 AI-enhanced Excalidraw 系统中，整体架构如下：

+------------------+ +--------------------+ | 用户浏览器 |<----->| Excalidraw 前端 | | (React + Canvas) | | (Web App / Plugin) | +------------------+ +----------+---------+ | | HTTPS / WebSocket v +-----------------------+ | AI 接口服务 | | (FastAPI / Flask) | +----------+------------+ | | API Call (REST) v +-------------------------------+ | 大语言模型服务 | | (OpenAI / 自托管 LLM) | +-------------------------------+

这一架构支持两种部署模式：