news 2026/4/23 12:43:11

三招让RAG检索开挂!大模型Query优化秘籍,小白也能秒变检索大神!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
三招让RAG检索开挂!大模型Query优化秘籍,小白也能秒变检索大神!
  • 查询重写:重新定义查询,使其更加具体和详细。
  • Step-back提示:生成更广泛的查询,以获得更好的上下文检索。
  • 子查询分解:将复杂查询分解为更简单的子查询。

每种技术都旨在通过修改或扩展原始查询来提高检索信息的相关性和全面性。

query转化的优点

RAG系统在检索最相关的信息时经常面临挑战,特别是在处理复杂或模糊的查询时。这些查询转换技术通过重新制定查询以更好地匹配相关文档或检索更全面的信息来解决这个问题。

  • 提升相关性:查询重写有助于检索更具体和相关的信息。
  • 更好的上下文:后退提示允许检索更广泛的上下文和背景信息。
  • 综合结果:子查询分解支持检索涵盖复杂查询的不同方面的信息。
  • 灵活性:每种技术可以单独使用,也可以结合使用,这取决于具体的用例。

示例介绍

示例查询:“气候变化对环境的影响是什么?”

查询重写,将其扩展到包括特定方面,如温度变化和生物多样性。

step-back提示,将其概括为“气候变化的一般影响是什么?”

子查询分解,将其分解为生物多样性、海洋、天气模式和陆地环境等问题。

结论

这些查询转换技术为增强RAG系统的检索能力提供了强大的方法。通过以各种方式重新表述查询,它们可以显著提高检索信息的相关性、上下文和全面性。这些方法在查询复杂或多方面的领域中特别有价值,例如科学研究、法律分析或全面的事实查找任务。

方案介绍

1. 查询重写

目的:使查询更加具体和详细,提高检索相关信息的可能性。

方案:重写的确认样不仅与原始查询相似,而且还提供不同的角度或透视图,从而提高最终生成的质量和深度。

2. Step-back提示

**目的:**生成更广泛、更通用的查询,帮助检索相关的背景信息。

**方案:**后退提示(Step-Back Prompting)旨在通过考虑高层次的概念和原则来解决复杂问题,与直接解决问题的方法形成对比。“抽象的目的不是为了让你更迷糊,而是创建了绝对精确的新的语义层次”。

3. 子查询分解

**目的:**将复杂查询分解为更简单的子查询,以便更全面地检索信息。

**方案:**Query分解关键思想是将一个复杂问题分解成一系列更简单的子问题,然后依次解决它们。解决每个子问题都得益于之前解决的子问题的答案。

方案实现和举例

本节我们将介绍上述方法的具体实现,同时给出对应的prompt,并举例说明效果:所有技术都使用大模型进行查询转换;自定义提示模板用于指导模型生成适当的转换,代码为每种转换技术提供了单独的功能,允许轻松地集成到现有的RAG系统中。

1 -查询重写

重新表述查询以改进检索。

query_rewrite_template = """You are an AI assistant tasked with reformulating user queries to improve retrieval in a RAG system. Given the original query, rewrite it to be more specific, detailed, and likely to retrieve relevant information. Original query: {original_query} Rewritten query:""" query_rewrite_prompt = PromptTemplate( input_variables=["original_query"], template=query_rewrite_template )

运行例子:

# example query over the understanding climate change dataset original_query = "气候变化对环境的影响是什么?" rewritten_query = rewrite_query(original_query) print("Original query:", original_query) print("\nRewritten query:", rewritten_query)

效果展示:

Original query: 气候变化对环境的影响是什么? Rewritten query: 气候变化对各种生态系统的具体影响是什么,包括温度、降水模式、海平面和生物多样性的变化?

2 -退步提示

生成更广泛的查询,以便更好地检索上下文。

# Create a prompt template for step-back prompting step_back_template = """You are an AI assistant tasked with generating broader, more general queries to improve context retrieval in a RAG system. Given the original query, generate a step-back query that is more general and can help retrieve relevant background information. Original query: {original_query} Step-back query:""" step_back_prompt = PromptTemplate( input_variables=["original_query"], template=step_back_template )

运行例子

original_query = "气候变化对环境的影响是什么?" step_back_query = generate_step_back_query(original_query) print("Original query:", original_query) print("\nStep-back query:", step_back_query)

效果展示:

Original query: 气候变化对环境的影响是什么? Step-back query: 气候变化的一般影响是什么?

3-子查询分解

将复杂查询分解为更简单的子查询。

subquery_decomposition_template = """You are an AI assistant tasked with breaking down complex queries into simpler sub-queries for a RAG system. Given the original query, decompose it into 2-4 simpler sub-queries that, when answered together, would provide a comprehensive response to the original query. Original query: {original_query} example: What are the impacts of climate change on the environment? Sub-queries: 1. What are the impacts of climate change on biodiversity? 2. How does climate change affect the oceans? 3. What are the effects of climate change on agriculture? 4. What are the impacts of climate change on human health?""" subquery_decomposition_prompt = PromptTemplate( input_variables=["original_query"], template=subquery_decomposition_template )

运行例子:

original_query = "气候变化对环境的影响是什么?" sub_queries = decompose_query(original_query) print("\nSub-queries:") for i, sub_query in enumerate(sub_queries, 1): print(sub_query)

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 11:26:59

【20年架构师经验分享】:精准定位并重写Python热点函数的黄金法则

第一章:精准定位并重写Python热点函数的黄金法则 在高性能Python应用开发中,识别并优化热点函数是提升执行效率的核心策略。热点函数指被频繁调用或占用大量CPU时间的函数,其性能直接影响整体系统表现。通过科学方法定位这些瓶颈,…

作者头像 李华
网站建设 2026/4/23 12:52:09

终极写作神器Manuskript:释放你的创作潜能

终极写作神器Manuskript:释放你的创作潜能 【免费下载链接】manuskript A open-source tool for writers 项目地址: https://gitcode.com/gh_mirrors/ma/manuskript 还在为写作过程中的混乱思绪而烦恼吗?Manuskript 这款开源写作工具,…

作者头像 李华
网站建设 2026/4/23 11:28:23

SSH代理转发技巧:跨跳板机连接TensorFlow训练节点

SSH代理转发技巧:跨跳板机连接TensorFlow训练节点 在现代AI研发体系中,一个常见的困境是:你手握强大的本地开发环境,却无法直接访问部署在内网深处的GPU训练集群。这些高性能节点通常被层层防火墙保护,仅允许通过一台跳…

作者头像 李华
网站建设 2026/4/23 16:11:01

艾尔登法环存档编辑器:终极游戏体验定制指南

艾尔登法环存档编辑器:终极游戏体验定制指南 【免费下载链接】ER-Save-Editor Elden Ring Save Editor. Compatible with PC and Playstation saves. 项目地址: https://gitcode.com/GitHub_Trending/er/ER-Save-Editor 《艾尔登法环》作为一款广受好评的开放…

作者头像 李华
网站建设 2026/4/23 13:16:53

供求求购供应发布VIP会员抖音快手微信小程序看广告流量主开源

这是一个功能丰富的微信小程序,主要用于信息发布和交易撮合平台。以下是该小程序的详细介绍: 小程序概述 这是一个综合性的信息发布平台,用户可以在上面发布和查找各类商品或服务信息,支持求购和供应两种信息类型。 主要功能模块 …

作者头像 李华