news 2026/5/2 15:03:39

大模型RAG实战:关键词召回+语义召回,如何平衡速度与准确率两难问题?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型RAG实战:关键词召回+语义召回,如何平衡速度与准确率两难问题?

文章探讨RAG系统中的召回策略,指出面临效率与准确率两大挑战。提出混合检索解决方案:先用关键词检索快速过滤数据解决效率问题,再通过语义检索提升准确性解决准确率问题。这种策略在文本数据场景下能实现速度与准确率的平衡,而多模态数据则需要特殊处理方法。


关键词召回和语义召回分别解决了两个问题,前者解决了速度问题,后者解决了准确率问题。

在RAG中检索召回一直是一个难题,一是效率问题,二是准确率问题;特别是在大批量数据中,怎么快速且准确地召回数据,一直是一个值得讨论的课题;因此,我们今天就讨论一下,关键词召回和语义检索召回。

召回策略的研究

从RAG的技术流程来说,召回属于一个单独的步骤,对模型来说只需要拿到召回的数据即可,模型本身不关心数据的来源以及数据怎么来,所以针对召回问题,可以使用现有的所有检索方案,包括但不仅限于SQL,语义检索,关键词检索等,其实本质来说召回就是在做一个搜索引擎。

在大模型爆火之前,检索方式大都是基于字符匹配和关键词检索的方式,最典型的就是SQL查询和ES分词检索,这也是普通开发者接触最多的东西。

那这些技术和RAG有什么关系呢?

前面说了,RAG的检索召回是一个独立的环节,任何有助于检索召回的技术都可以应用于这一阶段。但是,我们知道RAG大部分是应用于自然语言对话场景,因此很多没接触过或者对RAG没有深入研究的人,都会认为RAG只能用语义召回。

从理论上来说,语义召回更符合RAG的规范,但其中有一个很严重的问题是,语义召回由于要进行大量的向量运算,因此对算力的要求比较高,其次速度比较慢;在面对大数据量大场景时,只使用语义召回明显不是一个好的选择。

所以,为了解决这个问题,我们就需要使用多种召回策略,在速度和准确度之间达到一个平衡。

首先,目前来看最快的召回方式应该是使用SQL等字符匹配的方式,而且其不但速度快,而且准确率最高。但在RAG场景中,SQL查询能解决部分问题,但在某些场景中无法满足,如对文档内容进行检索。

所以,我们就要考虑另外两种方式,关键词检索和语义检索。

在大数据量RAG场景中,为了提升召回速度,我们可以混合检索的方式;首先,使用关键词检索,如jieba分词,通过关键词的方式在大量数据中进行快速过滤,关键词检索的优点有二,其一是速度快,由于不需要进行向量运算,其查询速度要比语义检索快得多;其二就是成本低,基于关键词检索的方式,不需要算力的支持,其本质上还是基于字符匹配的方式进行检索。当然,有些人为了提升关键词检索的准确率,也会使用相似度算法,来对召回的数据进行语义计算,从而提升准确度。

其次,在关键字检索的基础之上,我们再使用语义检索的方式,也就是相似度计算来提升召回数据的准确性;也就是说关键词检索解决了效率问题,语义检索解决了准确度问题。

通过混合这两种召回方式,就能在效率和准确率之间达到一个平衡;当然关键词召回的方式只适用于文本数据,如果涉及到多模态数据,除非使用的是内容提取为文本,然后通过文本进行召回的方式,否则就只能用多模态融合技术,也就是多模态embedding,解决多模态数据召回问题。

AI大模型从0到精通全套学习大礼包

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

只要你是真心想学AI大模型,我这份资料就可以无偿共享给你学习。大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!

如果你也想通过学大模型技术去帮助就业和转行,可以扫描下方链接👇👇
大模型重磅福利:入门进阶全套104G学习资源包免费分享!

01.从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点

02.AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线


03.学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的


04.大模型面试题目详解

05.这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!


如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/26 18:12:54

Excel MATCH函数全解析:精确定位、近似匹配与交叉查询实战

在Excel查找函数中,MATCH可能不如VLOOKUP知名,但它的定位能力却无可替代。作为INDEX的最佳搭档,MATCH函数通过三种匹配模式,实现了从精确定位到模糊查找的全方位数据定位功能。本文将深入解析MATCH函数的三大匹配类型及其综合应用…

作者头像 李华
网站建设 2026/4/27 12:59:09

别只会加缓存了:带你系统性设计高并发读写架构(附架构图)

0. 序章:当“加个 Redis”不再是万能解药 “系统慢了?加个 Redis 缓存一下。” “数据库 CPU 飙高?把热点数据丢 Redis 里。” 在 1-3 年经验的工程师眼里,Redis 仿佛是架构设计的“速效救心丸”。然而,当你的业务量…

作者头像 李华
网站建设 2026/4/23 12:30:22

收藏!AI Agent智能体从0到1构建指南(小白程序员必看)

AI Agent智能体,当前更精准的定义是LLM Agent,本质上是一种执行逻辑由底层大语言模型(LLM)主导调控的程序,也是大模型落地应用中极具潜力的核心形态。 相较于少样本提示(Few-Shot Prompting)、固…

作者头像 李华
网站建设 2026/4/29 5:41:10

20260127编译Rockchip瑞芯微原厂的Buildroot【linux-6.1内核】

rootrootrootroot-X99-Turbo:~/proj/RK3576_Linux6.1$ ll rootrootrootroot-X99-Turbo:~/proj/RK3576_Linux6.1$ ll *sh lrwxrwxrwx 1 rootroot rootroot 39 3月 8 2025 build.sh -> device/rockchip/common/scripts/build.sh* lrwxrwxrwx 1 rootroot rootroot 41 3月 …

作者头像 李华
网站建设 2026/4/30 6:39:40

DevOps实战系列 - 使用Arbess+GitLab实现.Net 项目自动化构建并主机部署

Arbess 是一款开源免费的 CI/CD 工具,工具支持一键安装零配置,页面设计简明易用。本文将详细介绍如何安装Arbess、GitLab,并创建配置流水线实现 .Net Core 项目构建并主机部署。 1、GitLab 安装与配置 本章节将介绍如何使用CentOS9搭建Gitl…

作者头像 李华
网站建设 2026/5/2 1:37:50

ESG招聘:如何讲好企业的绿色故事?

ESG(环境、社会及治理),正从一个企业管理的专业术语,迅速演变为新一代人才评估雇主价值的“隐形标尺”。对于面向校园和实习生的招聘而言,这股趋势更为明显。年轻人希望自己的职业起点,能与更宏大的社会价值…

作者头像 李华