news 2026/4/23 11:25:21

【必学收藏】大模型RAG技术全解析:从零开始掌握AI产品核心技能

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【必学收藏】大模型RAG技术全解析:从零开始掌握AI产品核心技能

本文详解RAG技术七大核心概念:向量数据库实现语义检索,混合检索提升精确度,分块嵌入优化知识管理,重排序提高内容相关性,上下文融合增强信息连贯性,准确率与召回率平衡检索质量,知识图谱强化实体关系理解。掌握这些技术,产品经理可构建更精准、可靠的AI产品,避免大模型幻觉问题。

1、向量数据库

向量数据库是 RAG 最重要的基础设施之一。

传统数据库的内容查询主要依赖“关键词匹配”,对查询的精确度要求很高。

比如,如果你查询“如何提高工作效率”,而数据库只有“时间管理技巧”内容,那么就无法搜索出任何内容。

而向量数据库就可以有效解决这个问题,它会把各种知识都转换成一组组数字(向量),这些数字能代表知识的内容和特点,

当你在 RAG 系统中输入查找信息时,它会把输入信息也转换成一组数字(向量),然后在数据库中找出最相关的知识,从而实现“语义检索”。

图片来源:百度

比如,下面的每个知识都转化为了一个 3 维向量(实际应用中可能把一个知识转化为几十甚至几千维的向量):

时间管理:[0.12,0.23,0.46]

工作地点:[0.92,0.82,0.65]

考勤制度:[0.83,0.93,0.78]

当用户查询“工作效率”,向量数据库就可以把“工作效率”转化为向量: [0.12,0.23,0.53]。

显然它和“时间管理”的向量 [0.12,0.23,0.46] 相似度很高——从业务上来说,是因为“时间管理”是提高“工作效率”的一种有效方法,这就导致两者的语义高度相关。

其实,这就是“语义检索”的过程。

在传统客服系统中,由于依赖“关键词匹配”,在面对复杂咨询时,就很难给出用户想要的答案。

而 AI 客服使用向量数据库,当用户咨询时,可以通过 “语义检索”快速找到最相关的答案,从而提升用户体验和满意度。

2、混合检索

图片来源:CSDN@智兔唯新

基于向量知识库的语义检索虽然很好,但是也存在 2 个问题:

首先是面对超大数据量,语义检索的速度不如传统的关键词检索。

其次是对于一些需要精确匹配的场景,关键词匹配更有优势。比如在法律文件检索中,法律条文、案例等对措辞的精准要求就很高。

因此,在很多场景下,RAG 会同时使用关键词检索和语义检索,从而尽可能的提升检索体验。

比如,在电商平台上,用户搜索“无线蓝牙耳机”。纯语义检索可能会推荐一些带有“无线”或“蓝牙”字样的普通耳机,但混合检索除了语义匹配,还会根据关键词“无线蓝牙”进行精确匹配,确保优先推荐符合“无线蓝牙耳机”这一完整要求的产品。

3、分块、嵌入与索引

RAG在存储知识时,为了更高效地管理和检索,通常会将原始文档按照一定的规则(如固定长度、语义单元等)分块。

就如同一本很长的小说,如果把它切成一个个章节或者更小的段落块,那么在查找某个故事情节时就更方便快捷。

分块以后,还需要把每一个块转化为向量,从而存储到向量数据库,这就是嵌入。

嵌入以后,还可以把向量存储到一个高效的检索结构中,以便快速进行相似性计算和检索,这就是索引。

比如,某法律咨询平台为用户提供在线法律咨询服务。

由于法律领域的知识库通常非常庞大且复杂,包含大量的文本信息,如法律条文、司法解释、案例判决书等。

在构建知识库时,就可以将法律条文、案例等长文本分割成多个小块,同时,利用索引结构记录每个小块的向量位置,以便快速检索。

这样,当用户输入法律问题,如“合同违约的赔偿标准是什么”,RAG 就可以从数据库中快速找到最相关的多个小块,并通过上下文融合来生成更为准确和完整的答案。

4、重排序(re-rank)

图片来源:公众号:AI大模型应用实践

当 RAG 从数据库中检索出多个内容时,需要选取相关性最大的内容喂给大模型,从而提高大模型的回答质量。

所谓重排序,是指 RAG 将初步检索出来的内容进行重新排序,其目的是将最相关的信息排在前面,从而选取出相对更为准确的内容。

打个比方,你想让 AI 搜索一批书籍,RAG 会先大致找出一批可能你想要的书籍,然后仔细评估每一本书和你需求的契合程度,把最符合你心意的书排在最前面,方便你优先查看。

重排序的应用非常广泛,比如电商平台根据用户需求初步筛选出一批商品后,就会通过“重排序”,根据用户的实时行为、偏好历史等,对推荐商品进行重新排序,把更符合用户当下需求的商品排在前面,提高推荐的准确性和实用性。

5、上下文融合

上下文融合是指 RAG 将从多个来源检索到的知识进行整合,以便为大模型提供更全面、连贯的输入内容,这样大模型的回答才能条理清晰、内容完整。

比如,在智能客服场景中,用户咨询:“我刚收到的商品有点瑕疵,我可以申请退货吗?”

要回答好这个问题,RAG 就需要从多个来源检索信息,比如用户的订单信息、退货政策等,再把这些内容整理成统一的内容,以便大模型能够基于内容生成高质量的回答。

6、准确率和召回率

准确率(Precision)是指在 RAG 检索到的内容中,与用户问题真正相关的内容的比例。

例如,在一个问答系统中,检索到 10 条知识,其中有 8 条与用户问题高度相关,那么准确率就是 80%。

准确率是衡量检索质量最重要的指标之一。

比如,智能客服在回答用户问题时,如果准确率不高,就会提供大量不相关或错误的答案,影响用户体验。

但是,只有高的准确率还不够,还必须有高的召回率。

所谓召回率(Recall),是指与用户问题相关的所有知识中,被成功检索到的比例。

例如,知识库中有 20 条与用户问题相关的知识,检索到 12 条,那么召回率就是 60%。

在实际应用场景中,召回率和准确率往往会成为跷跷板。比如如果过度追求高召回率,可能会导致检索结果中包含大量不相关的信息,影响准确率。反之亦然。

比如,在一个电商商品检索系统中,为了尽可能多地召回相关商品,降低了检索阈值,结果导致很多边缘相关甚至不相关的商品也出现在结果中。

在这种情况下,我们可以引入 F1 值进行综合评估,从而找到召回率和准确率之间的平衡点。

F1 值的计算公式是:F1= 2*(准确率*召回率)/(准确率+召回率)。

在这个公式中,当准确率或者召回率中的任何一个非常低时,F1 值也会相应的降低。

7、知识图谱

图片来源:CSDN@思通数科x

知识图谱就像是一个巨大的知识网络,把各种知识当作一个个节点,并且把有关系的节点进行连接。

比如,通过知识图谱可以对菜谱知识进行管理,把各个菜谱、原材料、烹饪方法连接起来,这样,当用户询问“用鸡蛋可以做哪些菜”时,RAG 就可以通过“菜谱-原材料”的连接关系,准确找到使用“鸡蛋”的菜谱。

通过知识图谱,RAG 能够捕捉到实体间的复杂关系,还能够基于已有的实体关系进行推理和扩展,发现更多潜在的相关信息,从而大大提升准确率和召回率。

比如,一年级有 5 个班,RAG 数据库中记录了 5 个班各自的期末成绩,但是并没有存储“一年级所有同学的平均成绩”。

这就导致,当用户询问“一年级期末平均成绩是多少”时,RAG 找不到相关内容,最后给出一个错误的答案。

但是,如果我们通过知识图谱建立了“一年级”和“5 个班级”之间的实体关系,RAG 就能根据根据这个关系找到“5 个班级的期末成绩”,再通过计算给到用户一个准确的回答。

最后,一个 RAG 系统的运行可能包含以下步骤:

1、向量数据库提供知识存储的基础设施

2、对内容进行分块、嵌入和索引,以方便检索

3、再通过知识图谱建立相关实体的关系,从而提高检索和生成的准确度

4、当用户查询时,通过混合检索、知识图谱等方式检索内容

5、然后把检索出来的内容进行重排序,选出最相关的内容

6、把选出的内容进行上下文融合,提供给大模型生成回答内容

7、最后,通过 F1 值对 RAG 系统的准确率和召回率进行综合评估

以上内容,你学废了吗?

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包

  • ✅ 从零到一的 AI 学习路径图
  • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
  • ✅ 百度/阿里专家闭门录播课
  • ✅ 大模型当下最新行业报告
  • ✅ 真实大厂面试真题
  • ✅ 2025 最新岗位需求图谱

所有资料 ⚡️ ,朋友们如果有需要《AI大模型入门+进阶学习资源包》下方扫码获取~

① 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

② 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

以上资料如何领取?

为什么大家都在学大模型?

最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。

风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

以上全套大模型资料如何领取?

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/28 2:09:29

OneTrainer模型微调终极指南:从零开始掌握AI训练技巧

OneTrainer模型微调终极指南:从零开始掌握AI训练技巧 【免费下载链接】OneTrainer OneTrainer is a one-stop solution for all your stable diffusion training needs. 项目地址: https://gitcode.com/gh_mirrors/on/OneTrainer 前言:快速上手On…

作者头像 李华
网站建设 2026/4/19 1:22:13

解析ConcurrentHashMap:get()方法无锁设计

🥂(❁◡❁)您的点赞👍➕评论📝➕收藏⭐➕关注👀是作者创作的最大动力🤞 💖📕🎉🔥 支持我:点赞👍收藏⭐️留言📝关注👀欢迎…

作者头像 李华
网站建设 2026/4/23 10:09:57

Meta公开抄阿里Qwen作业,还闭源了...

彭博社爆料,明年春季,Meta将发布一款代号为「Avocado(牛油果)」的模型。而这款新模型,很可能是「闭源」的。Meta的开源时代,要结束了。彭博社爆料,明年春季,Meta将发布一款代号为「A…

作者头像 李华
网站建设 2026/4/23 8:45:35

机械臂的舞蹈从数学开始——xArm6运动学拆解日记

xarm6 机械臂正逆运动学分析 使用改进的 DH 坐标系进行建模,进行正逆运动学分析,逆运动学利用解析解求出全部关节逆运动学分析搞机械臂就像玩拼装模型,只不过这里的零件是数学公式。今天咱们拿xArm6开刀,试试用改进DH参数法拆解它…

作者头像 李华
网站建设 2026/4/23 10:09:57

纯科研理论,不落地,纸上飞;纯行业分析,做不到,没资源 纯战略市场,空口号,走形式 纯产品定义,假需求,不赚钱 纯研发生产,无人买,闭门嗨 纯渠道销售,吹大牛,倒卖货 纯工程服务,无惊喜,死内卷 ……

环环相扣,环环互补: 纯科研理论,不落地,纸上飞 纯行业分析,做不到,没资源 纯战略市场,空口号,走形式 纯产品定义,假需求,不赚钱 纯研发生产,无人买…

作者头像 李华
网站建设 2026/4/23 10:10:09

Docker资源总是不够用?,深度解析云原生Agent调度瓶颈与突破方案

第一章:Docker资源总是不够用?重新审视云原生Agent调度困局在高密度容器化部署场景中,频繁出现的“Docker资源不足”问题往往并非源于物理资源枯竭,而是调度策略与运行时感知能力脱节所致。传统静态资源分配模型无法适应动态负载变…

作者头像 李华