像搭乐高一样组合AI想法：手把手教你用GoT框架解决复杂任务（附Python示例）-深圳市維司達科技有限公司

像搭乐高一样组合AI想法：手把手教你用GoT框架解决复杂任务（附Python示例）

当面对需要整合多份合同条款、合并技术文档或处理其他复杂文本任务时，传统AI方法往往显得力不从心。就像用乐高积木搭建复杂模型需要灵活组合不同模块一样，Graph of Thoughts（GoT）框架让我们能够将大语言模型（LLM）的推理过程分解、重组，最终构建出更强大的解决方案。

1. 为什么需要超越思维链的解决方案

在自然语言处理领域，我们早已习惯使用思维链（Chain-of-Thought, CoT）技术来引导模型进行分步推理。但当任务复杂度上升到需要合并多个独立推理路径时，线性思维链的局限性就暴露无遗。

想象你要合并三份来自不同部门的合同文档：

法务部的版本包含严谨的法律条款
技术部门提供了详细的产品规范
市场部则侧重商业合作框架

传统CoT方法会尝试按顺序处理这些文档，但无法有效识别和整合交叉引用、消除冗余条款或解决条款冲突。这就是GoT框架大显身手的地方。

GoT的核心优势对比：

方法	推理结构	多路径整合	回溯能力	适用场景
IO提示	单步	❌	❌	简单QA
CoT	线性链	❌	❌	分步推理
ToT	树状	有限	✅	多方案探索
GoT	图结构	✅	✅	复杂系统整合

2. GoT框架的核心构建模块

GoT将每个思考步骤视为图中的节点，依赖关系作为边。这种抽象让我们可以自由地组合、改进和优化思维路径。

2.1 基础组件解析

class ThoughtNode: def __init__(self, content, score=None): self.content = content # 思考内容（文本/代码/数据） self.score = score # 质量评分 self.dependencies = [] # 依赖的父节点 class GoTGraph: def __init__(self): self.nodes = [] self.operations = [] # 记录所有转换操作

2.2 关键思维转换操作

GoT框架支持三种核心操作：

生成操作- 基于现有节点创建新思路

def generate_new_thought(parent_thought, prompt_template): """基于父节点生成新思路""" full_prompt = f"{prompt_template}\n输入:{parent_thought.content}" response = llm.generate(full_prompt) new_node = ThoughtNode(response) new_node.dependencies.append(parent_thought) return new_node

聚合操作- 合并多个节点的精华

def aggregate_thoughts(node_list, merge_prompt): """合并多个相关思路""" inputs = "\n".join([f"文档{i+1}:\n{n.content}" for i,n in enumerate(node_list)]) response = llm.generate(f"{merge_prompt}\n{inputs}") new_node = ThoughtNode(response) new_node.dependencies.extend(node_list) return new_node

精炼操作- 迭代改进现有节点

def refine_thought(node, critique_prompt): """对现有思路进行迭代优化""" response = llm.generate(f"{critique_prompt}\n当前版本:\n{node.content}") refined_node = ThoughtNode(response) refined_node.dependencies.append(node) return refined_node

3. 实战：合同文档合并系统

让我们构建一个实际可用的文档合并解决方案。假设我们需要合并三份技术合作协议，每份文档约2000字。

3.1 系统架构设计

文档预处理 → 关键条款提取 → 冲突检测 → 条款合并 → 最终审核 ↑____________↓ ↑___________↓ 循环优化 交叉验证

3.2 分步实现代码

# 初始化GoT图 document_graph = GoTGraph() # 步骤1：文档预处理和分块 def preprocess_document(text, chunk_size=500): chunks = [text[i:i+chunk_size] for i in range(0, len(text), chunk_size)] return [ThoughtNode(chunk) for chunk in chunks] doc1_nodes = preprocess_document(legal_doc_text) doc2_nodes = preprocess_document(tech_doc_text) doc3_nodes = preprocess_document(market_doc_text) # 步骤2：提取各文档关键条款 extract_prompt = """请从以下合同段落中提取关键条款... 输出格式：- [条款类型]: 具体内容""" key_terms = [] for node in doc1_nodes + doc2_nodes + doc3_nodes: extracted = generate_new_thought(node, extract_prompt) key_terms.append(extracted) # 步骤3：识别冲突条款 conflict_check_prompt = """比较以下条款，识别是否存在冲突... 输出格式：冲突类型 | 条款1 | 条款2 | 建议解决方案""" conflict_results = [] for i in range(len(key_terms)): for j in range(i+1, len(key_terms)): merged = aggregate_thoughts([key_terms[i], key_terms[j]], conflict_check_prompt) conflict_results.append(merged) # 步骤4：生成合并版本 merge_prompt = """综合以下条款，生成最优版本... 考虑因素：法律效力、技术可行性、商业合理性""" final_draft = aggregate_thoughts(key_terms, merge_prompt) # 步骤5：最终优化 optimization_prompt = """请优化以下合同草案... 关注点：一致性、清晰度、完整性""" final_version = refine_thought(final_draft, optimization_prompt)

3.3 性能优化技巧

并行处理：不同文档的分块处理可以并行执行
缓存机制：存储中间结果避免重复计算
动态评分：为每个节点添加质量评分，指导后续处理重点

def evaluate_quality(node, criteria): """评估节点内容质量""" prompt = f"""按以下标准评分(1-10): {criteria} 内容:{node.content}""" response = llm.generate(prompt) node.score = extract_score(response)

4. 进阶应用场景

GoT的图结构灵活性使其适用于各类复杂任务：

4.1 技术文档自动化

多来源API文档整合
版本变更追踪与差异分析
生成统一的技术规范

4.2 商业智能分析

合并多个市场调研报告
竞争对手分析矩阵构建
跨数据源趋势预测

4.3 代码审查与优化

# 示例：代码优化工作流 original_code = ThoughtNode(code_text) # 生成优化建议 optimization_ideas = [generate_new_thought(original_code, f"优化建议{i}") for i in range(3)] # 合并最佳方案 best_practices = aggregate_thoughts(optimization_ideas, "合并代码优化建议") # 生成最终版本 optimized_code = refine_thought(original_code, f"应用这些优化:{best_practices.content}")