news 2026/6/26 10:10:20

查询重构与扩展:子问题分解、假设性文档嵌入与多轮对话改写

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
查询重构与扩展:子问题分解、假设性文档嵌入与多轮对话改写

RAG系统的检索质量,决定了大模型回答的上限。而查询重构与扩展,正是打破这个上限的核心利器。

一、问题:为什么你的RAG检索总在“答非所问”?

做过检索增强生成(Retrieval-Augmented Generation,RAG)的人大概都遇到过这样的情况:用户问了一个完全合理的问题,但检索就是漏掉了最相关的信息。

基础RAG的流程很简单:用户查询 → 向量化 → 向量检索 → 返回文档块 → LLM生成答案。但问题恰恰出在第一步——查询质量直接决定了检索质量

查询模糊、表述不当,或者用户对问题的抽象层次把握不准,检索结果就会出偏差,LLM拿到的上下文也跟着失真。用一句经典的话说:垃圾输入,垃圾输出,这个规律在RAG场景里同样成立。

更具体地说,传统检索面临三类典型问题:

  1. 词汇鸿沟:用户查询的措辞与文档中的表述不一致。比如问“How can LangSmith help monitor LLM applications?”,如果文档里从未出现过“monitor”“tracking”或“observability”,哪怕内容相关也检索不到。
  2. 短查询信息密度不足:用户往往输入简短的查询词,而向量数据库里存的是完整文档。查询和文档在嵌入空间中的距离天然疏远。
  3. 复杂查询无法一次覆盖:有些查询本身包含多个子问题
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/26 10:06:57

Dify低代码AI平台实战:构建可状态管理的旅行规划Agent

1. 什么是 Dify?一个真正能落地的低代码 AI 应用构建平台Dify 不是又一个“概念先行”的 AI 工具演示平台,也不是只给工程师看的 Demo 演示站。我从 2023 年底开始在三个不同客户项目中实际部署 Dify,覆盖客服知识库增强、内部技术文档智能助…

作者头像 李华
网站建设 2026/6/26 10:03:25

达人分发素材不够用?AI批量成片正在成为电商矩阵运营的新基础设施

过去几年,达人营销逐渐成为电商行业的重要增长渠道。越来越多品牌开始与达人合作,通过短视频种草、直播带货和内容分发获取流量。然而随着达人合作规模不断扩大,许多商家发现一个新的问题正在出现:达人越来越多,素材却…

作者头像 李华
网站建设 2026/6/26 9:57:30

二手日本电子 JEOL JSM-7500F 发射扫描电镜技术规格详解

本机为 Cold Field Emission 冷场发射 SEM 扫描电镜,核心二次电子分辨率 1.0nm15kV、1.4nm1kV,放大倍率 25 倍至 1,000,000 倍连续可调;Accelerating Voltage 加速电压 0.1kV–30kV,Probe Beam 束流区间 1pA–2nA,标配…

作者头像 李华
网站建设 2026/6/26 9:55:15

MuseTalk唇同步AI终极指南:让任何视频开口说话的完整教程

MuseTalk唇同步AI终极指南:让任何视频开口说话的完整教程 【免费下载链接】MuseTalk MuseTalk: Real-Time High Quality Lip Synchorization with Latent Space Inpainting 项目地址: https://gitcode.com/gh_mirrors/mu/MuseTalk MuseTalk是一款开源的实时高…

作者头像 李华
网站建设 2026/6/26 9:52:21

“一切为了打胜仗”开发哲学全景图

这份地图,是你用无数实战从0到1构建起一整套企业智慧管理系统后,所沉淀出的最宝贵的核心思想。它不是教科书,而是你的实战真经。1. 商业价值分析(先问值不值得做)核心任务:评估产品能否“开源”或“节流”&…

作者头像 李华