news 2026/4/22 17:16:38

AI核心知识70——大语言模型之Context Engineering(简洁且通俗易懂版)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI核心知识70——大语言模型之Context Engineering(简洁且通俗易懂版)

上下文工程 (Context Engineering)是随着大模型上下文窗口(Context Window)越来越大(从 4k 到 100万+ Token)而诞生的一门“信息整理术”

如果说 Prompt Engineering (提示工程) 是在教 AI “怎么做题”(给指令);

那么 Context Engineering (上下文工程) 就是在帮 AI “准备考试资料”(给数据)。

它的核心目标是:在有限(或昂贵)的窗口内,喂给 AI 最相关、最准确、结构最清晰的信息,让 AI 回答得更好。


1.🗂️ 核心比喻:给 CEO 准备简报

把大模型想象成一个日理万机的 CEO(虽然聪明,但对你的具体业务一无所知)。

你就是那个秘书。

  • 没有上下文工程:

  • 你把公司过去 10 年的所有发票、邮件、会议记录(几万页纸)一股脑扔在 CEO 桌子上,说:“老板,帮我查查去年 3 月亏了多少钱。”

    • 结果:CEO 看不过来,或者看漏了,或者直接发火(报错/胡说八道)。

  • 有上下文工程:

  • 你先筛选出去年 3 月的财务报表,用荧光笔画出重点,整理成一页 A4 纸的简报,放在 CEO 桌子最显眼的地方。

    • 结果:CEO 一眼就看到了答案,决策非常精准。

这就是上下文工程:清洗数据、筛选重点、排版整理。


2.⚔️ Context Engineering vs. Prompt Engineering

这两个词经常混用,但侧重点不同:

维度Prompt Engineering (提示工程)Context Engineering (上下文工程)
关注点指令 (Instructions)数据/背景 (Data/Background)
核心问题我该怎么问,AI 才能听懂?我该给 AI 喂哪些资料,它才能答对?
关键动作角色扮演、思维链 (CoT)、约束条件。文档检索 (RAG)、信息排序、内容压缩。
典型场景写文案、写代码、逻辑推理。知识库问答、读长篇小说、分析财报。

3.🛠️ 上下文工程的三大核心技术

当你有 100 个文档想让 AI 读时,你不能随便塞进去,你需要用到以下技巧:

A. 检索与筛选 (Retrieval & Filtering)
  • 痛点:窗口再大也是要钱的,而且废话太多会干扰 AI。

  • 做法:只把和用户问题最相关的那 5 个段落找出来(利用 Embedding 向量搜索),喂给 AI。少即是多。

B. 位置优化 (Ordering / Needle in a Haystack)
  • 痛点“中间丢失 (Lost in the Middle)”现象。大模型往往记得住开头结尾的信息,但容易忽略中间的信息。

  • 做法:把最重要的关键信息(Key Information),放在 Prompt 的最前面最后面,千万别埋在中间。

C. 信息压缩 (Compression)
  • 痛点:原文太长,Token 不够用。

  • 做法:先把长文档让 AI 总结成摘要(Summary),然后只把摘要喂给最终的对话模型。


4.🧩 为什么现在它这么重要?

以前窗口小(4k),你想塞东西也塞不进去,所以大家拼命研究 Prompt 技巧。

现在窗口大了(1M+),大家发现“垃圾进,垃圾出 (Garbage In, Garbage Out)”的问题严重了。

  • 场景:基于私有数据构建智能客服。

  • 挑战:公司有 1 万个 PDF 文档。

  • 上下文工程的任务

    • 把 PDF 拆解成小块。

    • 清洗掉乱码和页眉页脚。

    • 加上元数据(Metadata,比如“这是2024年的销售政策”)。

    • 当用户问“怎么退货”时,精准调取“退货政策”那一块,而不是把“招聘简章”也塞进去。


总结

上下文工程 (Context Engineering)是构建企业级 AI 应用(如 RAG 系统)的基本功。

它不再纠结于“怎么说话”,而是专注于“怎么喂料”

如果说 Prompt 是烹饪的厨艺 ,Context 就是食材的预处理。食材洗得越干净、切得越好,做出来的菜(AI 的回答)就越美味。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 5:02:15

使用 GLM-4 和 MCP 实现智能文章发布

使用 GLM-4 和 MCP 实现智能文章发布 本文介绍如何结合 GLM-4 大模型和 MCP (Model Context Protocol) 实现一个智能文章发布系统。 技术栈 GLM-4: 智谱AI的大语言模型MCP: 模型上下文协议Spring AI: Spring AI 框架Spring Boot: 应用框架 功能特性 智能理解用户意图自动提取文…

作者头像 李华
网站建设 2026/4/21 19:38:48

453345345

453475354

作者头像 李华
网站建设 2026/3/29 2:45:52

云服务器+宝塔面板部署Clawdbot,有没有搞头?

闲置服务器别吃灰!用宝塔面板搭个Clawdbot,真香 有一台装着宝塔面板的2核2G服务器闲置的躺着。 有个小站占不满资源,索性给它加个“智能副驾”——Clawdbot。 不用重装系统,没停现有业务,全程在宝塔里操作。 今天只说…

作者头像 李华