news 2026/4/23 10:11:30

作为后端开发你不得不知的 AI 知识——RAG

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
作为后端开发你不得不知的 AI 知识——RAG

作为后端开发你不得不知的 AI 知识——RAG

前言

我们知道,大模型的知识都是固化的,它不认识你公司的最新产品,而 RAG 就是为模型提供知识库的一种有效方法。

基于RAG(Retrieval Augmented Generation,检索增强生成)构建知识库,是大模型兴起之后最快被采纳接收的架构范式之一。当前,RAG 系统已经被广泛地应用在客服问答、个性化推荐、智能对话助手等场景中。RAG 技术能够弥补大模型因知识截止而无法获取最新信息的问题,并有效降低其产生幻觉的风险,而且 RAG 技术相比于大模型后训练或微调方式,以更加成本低的方式与企业的专有数据对接,以实现大模型快速技术验证和商业化尝试。

RAG 知识库的应用架构

基于 RAG 构建知识库的应用架构如下。可以简单划分为离线索引建构在线检索和生成过程

  • 离线向量过程通过把用户上传的文档进行文档智能解析、切片,再进行向量化存储到向量数据库。
  • 在线过程则把用户的请求问题向量化之后与向量库中的切片向量进行相似度比对,慈悲个人召回最接近用户问题的相关切片。

如今构建上图这样的 RAG 系统已经变得非常简单,开源社区和商业产品都提供了非常简便的构建方式。在满足复杂的业务需求的过程中,通常一个简单的 RAG 系统无法满足业务需求,会遭遇准确率和召回率的挑战、信息冗余噪声导致的模型幻觉、知识库庞杂难以管理等问题。当前 RAG 系统的构建也逐步向模块化、Agentic RAG 的高级架构演进。

从离线过程来看,文档解析技术除了经典的 OCR 和电子解析技术,也在利用大模型进行更准确的文档解析,比如对于图片类的文档,通过 VLM 视觉 理解大模型,能够对这类文档进行更全面的文档理解。

从在线检索过程来看,检索前、检索中、检索后过程里,都发展出很多的技术手段来加强和管理整体 RAG 的效果。

如:

  • 检索前可以增加 Query 改写、知识库路由等模块
  • 检索过程可以采用混合检索策略
  • 检索后可以增加充排序、拒识模块等。

从构建包含 RAG 的 AI 应用来看,Agentic RAG 成为新的趋势之一,用户将知识库检索作为大模型的工具之一,由大模型来决定是否以及何时进行检索以获取必要的知识库信息。另外,多模态 RAG 技术也是当前蓬勃发展的领域,随着多模态理解大模型能力的增强,多模态 Embedding 向量模型也取得了重大的发展。基于多模态向量模型的 RAG 系统在商品搜推、视频创作等各类场景已经获得了规模化的落地。

RAG 知识库的应用场景

知识库落地有广泛的应用场景,包括客服服务、个性化推荐、AI 陪伴、内容创作等。其中客服服务 RAG 是最广泛落地的应用之一,从业务特征来看,通常需要大量的业务背景知识,并且这些知识是不断更新的,例如常见问题解答(FAQ)、产品规格、故障排除指南以及公司政策等。

在这些场景里,知识库是严格知识的来源、可信任,作为降低大模型幻觉的重要手段。甚至在更加严肃的场景里,许多用户将大模型只作为知识库的整理工具,要求大模型回答需要严格遵循知识库里的知识,不能随意发挥,以避免严重的客诉问题。

不过当前 RAG 的应用也已经超越简单的回答。基于 RAG 的系统,叠加大模型分析客户对话数据等能力,能够帮助企业优化服务策略和挖掘销售线索等。RAG 的价值正在从解决幻觉这一技术问题,向赋能业务的更高层面演进。多模态 RAG 的兴起,将 RAG 的应用边界从纯粹的知识问答推向了更广阔的领域:

  1. 零售电商场景:用户 可以通过上传图片来检索商品,从而实现商品图搜和个性化推荐。
  2. 媒体娱乐领域:多模态 RAG 也帮助从海量音频视频内容中检索出特定的片段,从而服务于音视频内容分发以及新型的 AI 视频创作场景。

RAG 知识库的未来发展

大模型发展至今,RAG 作为最成熟的 AI 应用架构之一,尽管基础 RAG 的实现已趋于成熟,但仍有人认为其技术含量不高。然而,我们观察到,构建一个真正满足复杂业务需求的高级 RAG 系统仍然充满挑战,并且该领域正在不断演进。比如在当前 Advanced RAG 架构里,仍然有许多技术问题待解决。多模态 RAG 相关的技术,也在快速地发展当中,其应用场景和想象力空间更大。

无论未来 LLM 架构如何演变,只要它们仍然依赖外部知识来增强其能力,向量检索作为一种高效、语义化的上下文获取机制,仍然将发挥重要的价值。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 10:12:39

Python毕设选题推荐:基于python的租房管理系统的设计与实现基于python公寓出租管理系统【附源码、mysql、文档、调试+代码讲解+全bao等】

java毕业设计-基于springboot的(源码LW部署文档全bao远程调试代码讲解等) 博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、…

作者头像 李华
网站建设 2026/4/23 14:47:57

【收藏】LangChain从入门到实战:大模型应用开发完全指南 | 程序员必学

在大语言模型(LLM)应用开发领域,LangChain无疑是最具影响力的开源框架之一。它并非单一工具,而是一套完整的“组件生态”,核心价值在于打破LLM的“信息孤岛”与“能力边界”——让模型能调用外部工具、记忆对话上下文、…

作者头像 李华
网站建设 2026/4/23 11:15:11

2026年大模型金三银四求职全攻略:从小白到进阶,附赠全套学习路线+面试题库,如何成功锁定大模型相关岗位?

本文针对大模型领域的求职者,深入分析了行业趋势与热门岗位(如算法工程师、数据科学家等),并提供了从简历准备到面试技巧的全方位求职策略。此外,文章强调了持续学习的重要性,并整理了一份涵盖学习路线图、…

作者头像 李华
网站建设 2026/4/23 16:17:46

Qwen3-32B大模型vLLM启动建议

本文基于 vLLM 框架提供 Qwen3-32B 大模型的标准化启动部署说明,核心围绕启动命令中的关键配置项展开,明确各参数的作用、配置建议及硬件要求,确保模型可稳定启动并支持工具调用能力。1.启动命令参考vllm serve /[模型目录]/Qwen3-32B \--ser…

作者头像 李华
网站建设 2026/4/23 11:36:49

计算机Python毕设实战-python基于Web的酒店住宿管理系统的设计与实现民宿住宿管理系统【完整源码+LW+部署说明+演示视频,全bao一条龙等】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华