PocketFlow：100行代码构建极简LLM框架，实现智能体与工作流-深圳市維司達科技有限公司

1. 项目概述：为什么我们需要一个“口袋”里的LLM框架？

如果你在过去一两年里尝试过构建基于大语言模型的应用，大概率会和我有相似的感受：兴奋与疲惫并存。兴奋的是，我们终于有了像LangChain、CrewAI、AutoGen这样强大的框架，它们封装了Agent、Chain、Tool等概念，让构建复杂AI工作流成为可能。但疲惫感也随之而来——为了跑通一个简单的Demo，你可能需要安装数百兆的依赖，翻阅冗长的文档，最后发现大部分功能你根本用不上，框架的复杂性反而成了创新的绊脚石。

这就是PocketFlow诞生的背景。它的核心主张极其简单且叛逆：一个LLM框架的核心抽象，100行代码就足够了。这不是一个功能阉割的玩具，而是一次对“臃肿软件”的彻底反思。PocketFlow认为，当前主流框架将“抽象能力”与“具体实现”过度耦合，引入了大量应用层包装和供应商绑定，导致代码库膨胀至数万甚至数十万行。对于大多数开发者而言，我们需要的不是一个包罗万象的“瑞士军刀”，而是一把锋利、趁手、完全由自己掌控的“手术刀”。

PocketFlow就是这把手术刀。它剥离了所有非核心的“脂肪”，只保留最本质的图（Graph）抽象。在这个基础上，你可以用最直观的方式构建Agent、工作流、RAG系统，甚至实现多智能体协作。它的设计哲学是“极简”与“表达力”的平衡：代码量极小（核心文件仅100行），零依赖，零供应商锁定，但能实现其他框架能实现的绝大多数模式。更重要的是，它倡导并实践了“智能体编码”这一新兴范式——让AI智能体（例如Cursor AI）来编写智能体应用，将开发效率提升一个数量级。无论你是想快速验证一个AI想法的新手，还是厌倦了复杂框架束缚的资深工程师，PocketFlow都值得你花上十分钟了解一下。

2. 核心设计哲学：极简主义的胜利

2.1 当前LLM框架的“肥胖症”问题

在深入PocketFlow之前，我们有必要先诊断一下当前生态的“病症”。下表清晰地展示了主流框架的“体重”：

框架	核心抽象	应用特定封装	供应商特定封装	代码行数	体积
LangChain	Agent, Chain	非常多（如QA、摘要）	非常多（如OpenAI、Pinecone）	~405,000	>166 MB
CrewAI	Agent, Task	非常多（如文件读取、搜索工具）	非常多（如OpenAI、Anthropic）	~18,000	>173 MB
LangGraph	Agent, Graph	一些（如语义搜索）	一些（如Postgres存储）	~37,000	>51 MB
AutoGen	Conversable Agent	一些（如工具Agent、聊天Agent）	许多（可选）	~7,000 (仅核心)	>26 MB (仅核心)
PocketFlow	Graph	无	无	100	~56 KB

问题一：抽象泄露与过度封装。许多框架试图为每一种可能的用例（如“总结”、“问答”）提供现成的“链”或“工具”。这看似方便，实则限制了灵活性。当你的需求稍微偏离预设轨道时，你就不得不深入框架内部，与复杂的继承关系和隐藏的状态管理作斗争。

问题二：供应商锁定。框架深度集成特定模型提供商（如OpenAI）或向量数据库（如Pinecone）的SDK。切换供应商往往意味着重写大量业务逻辑，迁移成本高昂。

问题三：认知负荷与调试困难。庞大的代码库和复杂的抽象层使得学习曲线陡峭。当应用出现异常时，追踪问题源头如同大海捞针，你不得不穿越层层封装，才能看到真正与LLM交互的那几行代码。

PocketFlow的解决方案是“釜底抽薪”。它认为，LLM应用的本质是数据的流动与转换，这天然地可以用有向无环图来建模。图中的节点是处理单元（可以是调用LLM、执行函数、查询数据库），边定义了数据流动的方向。只要实现了这个最基础的图抽象，并提供一个轻量级的执行引擎，开发者就获得了构建一切复杂模式的基石。

2.2 PocketFlow的百行核心：图抽象的极致表达

PocketFlow的核心源码在pocketflow/__init__.py文件中，名副其实的100行左右。我们拆解一下它的核心构成：

Node类：图的节点。它本质上是一个可调用对象，接收一个上下文字典context，执行一些操作（如调用LLM、运行函数），并可以选择性地修改上下文或返回结果。这是所有功能的原子单位。
Flow类：图的容器和执行引擎。它维护一组节点和边（定义节点间的依赖关系）。其run方法是核心，它根据边的定义，以正确的拓扑顺序执行节点，并将上一个节点的输出传递给下一个节点作为输入的一部分。

这个设计的精妙之处在于其极致的简洁和强大的表现力。因为节点只是一个接收并返回上下文的函数，所以你可以用任何你喜欢的方式来实现它：

调用OpenAI API？没问题，写个函数封装一下。
使用本地开源模型？直接集成llama.cpp或vLLM的调用。
需要执行一个Python函数？直接把函数包装成节点。
想要实现复杂的条件逻辑？在节点函数内部写if-else或者实现一个专用的路由节点。

由于没有预设的“LLM节点”或“工具节点”概念，你获得了完全的自由。同时，因为框架本身不包含任何第三方SDK，所以也实现了真正的零供应商锁定。你的依赖就是你的选择。

实操心得：理解“上下文”是关键PocketFlow中流动的“上下文”是一个Python字典。它就像是整个工作流的共享内存或状态总线。每个节点都可以读取其中的值，也可以写入新的值。设计一个好的上下文结构（比如，明确哪些键是输入，哪些键是中间结果，哪些键是最终输出）是构建清晰、可维护工作流的第一步。我习惯用类似input_text、llm_response、final_answer这样的键名来保持清晰。

3. 从零开始：安装与第一个“流”

3.1 两种安装方式与环境准备

PocketFlow的安装简单到令人发指，这与其哲学一脉相承。

方式一：使用pip安装（推荐）这是最标准的方式，适合大多数项目。

pip install pocketflow

安装后，你就可以在项目中通过import pocketflow来引入核心的Flow和Node类。

方式二：直接复制源码（极致轻量）如果你追求项目的绝对纯净和可控，或者需要在严格受限的环境中使用，可以直接将那100行核心代码复制到你的项目目录中。去它的GitHub仓库找到pocketflow/__init__.py文件，复制内容，在你自己的项目中创建一个同名文件粘贴即可。这样，你的项目就对PocketFlow实现了“零依赖”。

环境准备：关键在于LLM配置PocketFlow本身不关心你用什么LLM。因此，你需要自行准备LLM的调用环境。最常见的是使用OpenAI的API：

安装OpenAI Python SDK：pip install openai
设置环境变量OPENAI_API_KEY为你的API密钥。可以在终端中执行export OPENAI_API_KEY='your-key'，或在代码中通过os.environ['OPENAI_API_KEY'] = 'your-key'设置。

当然，你也可以使用Anthropic、Google Gemini，或者本地部署的模型，只需准备好相应的客户端库和配置即可。

3.2 构建第一个聊天流：Hello, PocketFlow！

让我们用一个最简单的例子，感受一下PocketFlow的用法。我们将创建一个聊天流，它向LLM提问并获取回答。

import pocketflow as pf from openai import OpenAI # 0. 初始化OpenAI客户端（这是你的业务代码，不是PocketFlow的部分） client = OpenAI() # 1. 定义节点函数 def generate_greeting(context): """节点1：生成一个问候语问题。""" # 从上下文获取名字，如果没有则使用默认值 name = context.get('name', '开发者') question = f"请用中文向{name}问好，并简单介绍PocketFlow。" # 将问题存入上下文，供下一个节点使用 context['question'] = question return context def call_llm(context): """节点2：调用LLM获取回答。""" question = context['question'] # 调用OpenAI API（这是你的业务逻辑） response = client.chat.completions.create( model="gpt-3.5-turbo", messages=[{"role": "user", "content": question}], temperature=0.7, ) # 提取回答并存入上下文 answer = response.choices[0].message.content context['answer'] = answer return context def print_result(context): """节点3：打印最终结果。""" print(f"问题：{context['question']}") print(f"回答：{context['answer']}") return context # 2. 创建节点对象 node1 = pf.Node(generate_greeting, name="生成问题") node2 = pf.Node(call_llm, name="调用LLM") node3 = pf.Node(print_result, name="打印结果") # 3. 创建流，并定义节点执行顺序：node1 -> node2 -> node3 flow = pf.Flow() flow.add([node1, node2, node3]) # 添加节点 flow.add_edge(node1, node2) # node1 完成后执行 node2 flow.add_edge(node2, node3) # node2 完成后执行 node3 # 4. 运行流，传入初始上下文 initial_context = {'name': '每一位读者'} result_context = flow.run(initial_context) # 5. 可以从最终上下文中获取结果 print("\n最终上下文中的答案：", result_context.get('answer'))

运行这段代码，你会看到LLM生成的问候和介绍。这个例子虽然简单，但揭示了PocketFlow工作流的所有要素：

节点：三个函数，各司其职（准备输入、调用AI、处理输出）。
边：定义了清晰的执行顺序。
上下文：在节点间传递数据的字典。
流：将一切组织起来并执行。

注意事项：节点函数的签名每个节点函数必须接受一个参数（通常命名为context），并且必须返回一个值（通常是修改后的context字典）。这是PocketFlow执行引擎能够调度节点的约定。如果节点不需要修改上下文，也请原样返回return context。

4. 核心模式实现：Agent、Workflow与RAG

PocketFlow的威力在于，用同一套简单的图抽象，你可以实现LLM应用开发中几乎所有常见的设计模式。官方提供了大量示例，我们深入剖析几个最核心的。

4.1 实现一个智能体

在其他框架中，一个“Agent”可能是一个复杂的类，拥有工具、记忆、推理循环等属性。在PocketFlow中，一个智能体本质上是一个可以循环执行、并能根据条件选择不同路径的图。

让我们构建一个简单的“研究智能体”，它可以根据用户问题决定是直接回答，还是需要先进行网页搜索。

import pocketflow as pf from openai import OpenAI import requests from bs4 import BeautifulSoup client = OpenAI() # --- 工具函数（也是节点）--- def web_search(context): """模拟网页搜索工具。""" query = context.get('query') # 这里简化处理，实际应调用SerperAPI或Searxng等 print(f"[工具] 正在搜索: {query}") # 模拟返回搜索结果 context['search_result'] = f"关于'{query}'的模拟搜索结果：PocketFlow是一个极简LLM框架..." return context def direct_answer(context): """直接回答节点。""" question = context['question'] response = client.chat.completions.create( model="gpt-3.5-turbo", messages=[{"role": "user", "content": f"请直接回答：{question}"}], ) context['final_answer'] = response.choices[0].message.content return context def answer_with_search(context): """基于搜索的结果回答节点。""" question = context['question'] search_result = context['search_result'] response = client.chat.completions.create( model="gpt-3.5-turbo", messages=[ {"role": "user", "content": f"问题：{question}\n请参考以下信息进行回答：\n{search_result}"} ], ) context['final_answer'] = response.choices[0].message.content return context # --- 决策逻辑（核心）--- def decide_action(context): """决策节点：判断是否需要搜索。""" question = context['question'].lower() # 简单的关键词判断：如果问题包含“最新”、“新闻”、“2024”等，则需要搜索 need_search_keywords = ['最新', '新闻', '2024', 'current', 'recent'] need_search = any(keyword in question for keyword in need_search_keywords) context['need_search'] = need_search # 这个节点不执行实际动作，只做路由判断 return context def route_based_on_decision(context): """路由节点：根据决策结果，将上下文路由到不同分支。""" # 这是一个关键技巧：节点可以通过修改上下文来影响流的走向 # 但PocketFlow核心是DAG，复杂路由需结合条件节点或外部逻辑。 # 更动态的路由通常需要在节点内部实现循环，或使用更高级的Pattern。 # 此处为演示，我们假设在流外部根据结果手动选择执行路径。 # 实际上，你可以设计一个“控制器”节点来管理循环。 pass # --- 构建流 --- # 注意：这是一个简化示例，实际智能体可能需要循环（如思考-行动-观察）。 # PocketFlow通过将“执行单步”封装成一个子流，然后在主逻辑中循环调用该子流来实现。 decision_node = pf.Node(decide_action, name="决策") search_node = pf.Node(web_search, name="搜索") direct_ans_node = pf.Node(direct_answer, name="直接回答") search_ans_node = pf.Node(answer_with_search, name="搜索后回答") # 创建两个可能的执行流 search_flow = pf.Flow() search_flow.add([search_node, search_ans_node]) search_flow.add_edge(search_node, search_ans_node) direct_flow = pf.Flow() direct_flow.add([direct_ans_node]) # 主执行逻辑（模拟） def run_research_agent(question): context = {'question': question} # 1. 执行决策 decision_node(context) if context.get('need_search'): print("决策：需要搜索。") context = search_flow.run(context) else: print("决策：直接回答。") context = direct_flow.run(context) print(f"\n最终答案：{context['final_answer']}") return context # 测试 run_research_agent("PocketFlow是什么？") run_research_agent("PocketFlow最新的版本有什么更新？")

这个例子展示了如何用PocketFlow的节点和流来组织智能体的逻辑。更复杂的智能体（如拥有多工具、记忆、反思能力）可以通过组合更精细的节点和子流来实现。官方示例中的pocketflow-agent和pocketflow-multi-agent提供了更完整的实现。

4.2 构建一个工作流

工作流是顺序或并行执行一系列步骤的经典模式。PocketFlow的图结构天生适合表达顺序工作流。让我们实现一个内容创作工作流：生成大纲 -> 撰写正文 -> 润色风格。

import pocketflow as pf from openai import OpenAI client = OpenAI() def generate_outline(context): topic = context['topic'] prompt = f"为关于'{topic}'的文章生成一个详细的大纲，包含引言、3个主要部分和结论。" response = client.chat.completions.create( model="gpt-3.5-turbo", messages=[{"role": "user", "content": prompt}], temperature=0.8, ) context['outline'] = response.choices[0].message.content print("[步骤1] 大纲已生成。") return context def write_content(context): outline = context['outline'] prompt = f"根据以下大纲，撰写完整的文章正文。大纲：\n{outline}" response = client.chat.completions.create( model="gpt-3.5-turbo", messages=[{"role": "user", "content": prompt}], temperature=0.7, ) context['draft'] = response.choices[0].message.content print("[步骤2] 正文草稿已完成。") return context def apply_style(context): draft = context['draft'] style = context.get('style', '专业技术博客') prompt = f"将以下文章草稿润色为'{style}'风格：\n{draft}" response = client.chat.completions.create( model="gpt-3.5-turbo", messages=[{"role": "user", "content": prompt}], temperature=0.5, ) context['final_article'] = response.choices[0].message.content print("[步骤3] 风格润色完成。") return context # 构建顺序工作流 node_outline = pf.Node(generate_outline, name="生成大纲") node_write = pf.Node(write_content, name="撰写正文") node_style = pf.Node(apply_style, name="应用风格") writing_flow = pf.Flow() writing_flow.add([node_outline, node_write, node_style]) writing_flow.add_edge(node_outline, node_write) writing_flow.add_edge(node_write, node_style) # 运行工作流 initial_ctx = {'topic': '极简主义在软件开发中的实践', 'style': '生动有趣的科普文章'} result_ctx = writing_flow.run(initial_ctx) print("\n" + "="*50) print("最终文章：") print("="*50) print(result_ctx['final_article'][:500] + "...") # 打印前500字符

这个工作流清晰、直观。每个节点代表一个明确的任务，数据通过上下文顺序传递。你可以很容易地扩展这个工作流，比如在撰写正文后加入一个“事实核查”节点，或者在润色前加入一个“翻译”节点。

4.3 搭建一个RAG系统

检索增强生成是当前AI应用的热点。PocketFlow可以优雅地构建RAG流程：文档加载 -> 分块 -> 向量化存储 -> 查询检索 -> 生成回答。

import pocketflow as pf from openai import OpenAI import hashlib client = OpenAI() # 假设我们有一个简单的内存向量存储（实际项目请用Chroma、Weaviate等） vector_store = {} def load_and_chunk(context): """模拟：加载文档并分块。""" document = context['document'] # 简单按句号分块 chunks = [chunk.strip() for chunk in document.split('.') if chunk.strip()] context['chunks'] = chunks print(f"[RAG] 文档已加载并分块为 {len(chunks)} 个片段。") return context def embed_and_store(context): """模拟：为文本块生成向量并存储。""" chunks = context['chunks'] for i, chunk in enumerate(chunks): # 模拟生成向量（这里用哈希值代替，实际应调用text-embedding-ada-002等） vector = hashlib.md5(chunk.encode()).hexdigest()[:8] vector_store[vector] = chunk print(f"[RAG] 存储块 {i}: {chunk[:30]}... -> 向量 {vector}") context['vector_store'] = vector_store return context def retrieve(context): """模拟：根据查询检索相关文本块。""" query = context['query'] # 模拟检索：这里简单返回所有块（实际应用应计算相似度） retrieved_chunks = list(vector_store.values())[:3] # 假设返回最相关的3个 context['retrieved_text'] = "\n---\n".join(retrieved_chunks) print(f"[RAG] 为查询 '{query}' 检索到 {len(retrieved_chunks)} 个相关片段。") return context def generate_answer(context): """基于检索到的上下文生成答案。""" query = context['query'] retrieved = context['retrieved_text'] prompt = f"""请基于以下上下文信息回答问题。如果上下文不包含答案，请说明你不知道。 上下文： {retrieved} 问题：{query} 答案：""" response = client.chat.completions.create( model="gpt-3.5-turbo", messages=[{"role": "user", "content": prompt}], ) context['answer'] = response.choices[0].message.content return context # 构建RAG流（分为索引和查询两个阶段） # 1. 索引流 node_load = pf.Node(load_and_chunk, name="加载分块") node_embed = pf.Node(embed_and_store, name="向量化存储") indexing_flow = pf.Flow() indexing_flow.add([node_load, node_embed]) indexing_flow.add_edge(node_load, node_embed) # 2. 查询流 node_retrieve = pf.Node(retrieve, name="检索") node_answer = pf.Node(generate_answer, name="生成答案") querying_flow = pf.Flow() querying_flow.add([node_retrieve, node_answer]) querying_flow.add_edge(node_retrieve, node_answer) # 使用示例 print("=== 阶段1：索引文档 ===") doc_text = "PocketFlow是一个仅100行代码的极简LLM框架。它基于图抽象，零依赖。该框架支持智能体、工作流和RAG等模式。它的设计哲学是简洁和表达力。" index_ctx = indexing_flow.run({'document': doc_text}) print("\n=== 阶段2：执行查询 ===") query_ctx = {'query': 'PocketFlow的设计哲学是什么？', 'vector_store': vector_store} result_ctx = querying_flow.run(query_ctx) print(f"\n问题：{result_ctx['query']}") print(f"答案：{result_ctx['answer']}")

这个例子展示了如何用两个独立的流来分别处理RAG的索引和查询阶段。在实际项目中，你会用专业的向量数据库替换内存存储，并用真实的嵌入模型生成向量。PocketFlow的轻量性使得你可以自由选择任何技术栈，而不被框架绑架。

5. 进阶技巧与最佳实践

掌握了基础模式后，如何用PocketFlow构建健壮、高效的应用？以下是一些来自实战的经验。

5.1 错误处理与节点健壮性

在流水线中，一个节点的失败不应导致整个流程崩溃。PocketFlow本身不提供内置的错误处理，但这正是其灵活之处——你可以自己实现。

import traceback def robust_node_function(context): """一个具有错误处理能力的节点函数模板。""" try: # 主要的业务逻辑 # ... 你的代码 ... context['result'] = some_operation(context['input']) context['node_status'] = 'success' except Exception as e: # 捕获异常，记录错误，并可能提供降级方案 print(f"节点执行失败: {e}") traceback.print_exc() context['node_status'] = 'failed' context['error'] = str(e) # 可以选择设置一个默认值，让流程继续 context['result'] = None finally: return context # 在流层面，可以添加一个“检查点”节点，根据上游节点的状态决定是否继续 def checkpoint(context): if context.get('previous_node_status') == 'failed': # 可以选择跳过后续节点，或执行补偿逻辑 print("上游节点失败，终止流程或执行备用方案。") # 通过返回一个特殊上下文或抛出特定异常来终止流 # PocketFlow中，你可以让节点返回一个标记，并在主控逻辑中判断 context['flow_should_stop'] = True return context

更高级的模式是实现一个“重试节点”，包装可能失败的节点逻辑，并尝试多次调用。

5.2 流的组合与嵌套

复杂的应用通常由多个子流组成。PocketFlow的Flow对象本身也可以作为一个“节点”被加入到另一个流中，实现嵌套。

def subflow_as_node(context): """将一个子流的执行包装成一个节点函数。""" # 定义或获取一个子流 sub_flow = create_data_processing_flow() # 假设这个函数返回一个定义好的Flow # 运行子流，传入当前上下文（或其中一部分） sub_context = {'data': context['raw_data']} result_sub_context = sub_flow.run(sub_context) # 将子流的结果合并回主上下文 context['processed_data'] = result_sub_context['processed_data'] return context # 在主流中使用 subflow_node = pf.Node(subflow_as_node, name="数据处理子流") main_flow.add(subflow_node)

这种方式非常适合模块化开发。你可以将数据预处理、模型调用、后处理等环节分别封装成子流，然后在主流中像搭积木一样组合它们。

5.3 状态管理与上下文设计

上下文字典是PocketFlow中节点通信的唯一渠道。良好的上下文设计至关重要。

命名清晰：使用具有描述性的键名，如user_input,parsed_intent,llm_response_raw,final_output。避免使用模糊的data,result1,result2。
结构扁平化：尽量避免在上下文中嵌套过深的字典或列表。这有助于调试和节点访问。如果需要复杂结构，考虑使用一个专门的键来存放，如context['intermediate_results'] = {'step1': ..., 'step2': ...}。
版本控制：对于长期运行或可能迭代的流，可以考虑在上下文中加入一个version或pipeline_id字段，便于追踪和调试。
敏感信息：不要在上下文中明文传递API密钥等敏感信息。通过环境变量或外部配置来管理。

5.4 调试与日志记录

由于PocketFlow极其轻量，调试主要依赖于标准的Python调试工具和清晰的日志。

在每个节点开始和结束时打印日志：记录输入输出的关键信息。

def my_node(context): print(f"[{node.name}] 输入: {list(context.keys())}") # ... 处理逻辑 ... print(f"[{node.name}] 输出: {context.get('output_key')}") return context

使用Python的pdb或breakpoint()：在怀疑有问题的节点函数内部设置断点。

可视化流结构：虽然PocketFlow没有内置可视化，但你可以很容易地写一个函数来打印流的节点和边，帮助理解执行顺序。

def print_flow_structure(flow): print("节点列表:", [n.name for n in flow.nodes]) # 需要根据PocketFlow内部实现访问边信息，如果暴露的话

6. “智能体编码”实战：用AI构建AI工作流

PocketFlow大力推崇“智能体编码”范式。这不仅仅是使用AI辅助编程，而是指将AI智能体作为主要的编码协作者，人类负责高层设计和审核。结合像Cursor这样的AI编程助手，你可以获得10倍的生产力提升。

工作流程如下：

人类设计：你在文档中描述你想要的应用功能、数据流、节点职责。例如：“创建一个内容审核工作流，输入是一段文本，先经过敏感词过滤节点，再经过情感分析节点，最后根据结果路由到‘通过’或‘驳回’节点。”
智能体实现：将设计文档提供给Cursor（或其他AI编程助手）。提示它：“请根据以下设计文档，使用PocketFlow框架实现这个工作流。要求代码清晰，有注释，并包含一个简单的示例。”
审查与迭代：AI生成代码后，你进行审查、测试，并提出修改意见。AI可以快速响应修改，比如“为过滤节点添加正则表达式模式”、“为情感分析节点增加置信度阈值”。

一个具体的Prompt示例：

你是一个资深的Python开发者，精通PocketFlow框架。请根据以下需求实现一个智能体工作流： **项目目标**：构建一个“客户查询分类与路由智能体”。 **输入**：一段来自客户的文本查询。 **处理流程**： 1. **意图识别节点**：调用LLM（GPT-3.5-turbo），分析查询意图。可能的意图包括：“产品咨询”、“技术支持”、“账单问题”、“投诉建议”。 2. **情绪分析节点**：调用LLM，判断客户情绪（积极、中性、消极）。 3. **路由决策节点**：根据意图和情绪，决定将查询路由到哪个处理队列。 - “产品咨询” + 任何情绪 -> 路由到“销售队列” - “技术支持” + “消极” -> 路由到“高级技术支持队列” - “技术支持” + 其他情绪 -> 路由到“普通技术支持队列” - “账单问题” -> 路由到“财务队列” - “投诉建议” -> 路由到“客服经理队列” 4. **格式化输出节点**：将最终的路由决定和原始查询格式化为一个JSON对象。 **输出**：一个JSON对象，包含 `original_query`, `detected_intent`, `sentiment`, `routed_queue`。 **要求**： - 使用PocketFlow框架组织节点和流。 - 为每个节点编写清晰的函数，并添加注释。 - 模拟LLM调用（可以用打印语句模拟API响应）。 - 编写一个主函数来演示整个流程。 - 代码应易于理解和扩展。

将这样的Prompt交给Cursor，它能在几分钟内生成一个结构清晰、可运行的PocketFlow代码骨架。你只需要填充真实的LLM API调用和业务逻辑细节即可。这种方式极大地降低了实现复杂AI工作流的门槛，让你能更专注于架构设计和业务逻辑，而不是繁琐的框架API记忆。

7. 常见问题与排查实录

在实际使用PocketFlow的过程中，你可能会遇到一些典型问题。以下是我踩过的一些坑和解决方案。

问题1：节点执行顺序不符合预期。

可能原因：边的添加顺序或逻辑有误。PocketFlow的执行顺序依赖于你通过add_edge建立的依赖关系。确保你添加的边正确反映了节点间的数据依赖。
排查步骤：
1. 打印流的节点和边结构，可视化检查。
2. 在每个节点的开始和结束打印日志，确认实际执行顺序。
3. 检查是否有节点不依赖于任何其他节点，却又不是起点，这可能导致执行时机问题。

问题2：上下文数据在节点间丢失或覆盖。

可能原因：节点函数内部意外修改或删除了上下文中的键，或者多个节点使用了相同的键名导致冲突。
解决方案：
- 约定命名空间：为不同模块的节点使用前缀，如preprocess_input,llm_raw_output,postprocess_final_answer。
- 写时复制：对于复杂的中间数据，如果担心被修改，可以在传递给下一个节点前进行深拷贝：import copy; context_for_next = copy.deepcopy(context)。
- 清晰的数据契约：在文档中明确每个节点的输入和输出键。

问题3：流在某个节点后卡住或无输出。

可能原因：该节点函数可能抛出了未处理的异常，但被静默捕获了；或者函数陷入死循环；又或者节点函数忘记返回context字典。
排查步骤：
1. 在节点函数内部添加详细的try-except块，打印异常信息。
2. 检查节点函数逻辑，确保存在结束条件。
3. 最容易被忽略的一点：确认节点函数最后一行是return context。如果没有返回值，PocketFlow接收到的就是None，会导致后续节点无法获取数据。

问题4：如何实现条件分支或循环？

PocketFlow核心是DAG（有向无环图），不直接支持循环或动态分支。但这可以通过设计模式解决。
条件分支：实现一个“路由节点”，它根据上下文中的某个值，决定接下来执行哪个子流。然后在主控代码中（流外部），根据路由节点的结果，手动调用对应的子流。或者，将条件逻辑封装在一个节点内部，该节点内部调用不同的函数。
循环：将需要循环的部分（例如，智能体的“思考-行动-观察”单步）封装成一个子流。然后在主控代码中使用while循环，反复运行这个子流，直到满足退出条件（例如，上下文中的should_continue标志为False）。

问题5：与外部服务（数据库、API）集成的最佳实践？

初始化连接放在流外部：在创建流之前，初始化数据库连接池、API客户端等。将这些客户端对象作为上下文的一部分传递给节点，或者使用闭包/全局变量（需谨慎）让节点函数可以访问到。
节点内处理会话：每个节点函数负责在需要时从连接池获取连接，使用完毕后妥善关闭或归还。
错误处理与重试：对于网络请求等可能失败的操作，务必在节点内实现重试机制和优雅降级。

PocketFlow的魅力在于它的极简。它不会帮你解决所有问题，但它给了你解决所有问题的工具和完全的自由度。从简单的线性工作流到复杂的多智能体系统，你都可以用这100行代码奠定的基石来构建。开始用它来创造吧，你会发现，限制你想象力的不再是框架，而是你对问题的理解。