news 2026/4/23 15:47:06

RAG核心技术解析:检索方式与文档切片逻辑

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RAG核心技术解析:检索方式与文档切片逻辑

RAG(检索增强生成):检索方式、文档切片(Chunking)的实现逻辑


目录

    • 一、RAG的核心检索方式
      • 1. 基于向量的检索(Vector Retrieval)
        • 核心原理
        • 实现方式
        • 代码实例(基于Chroma+Sentence-BERT)
      • 2. 关键词检索(Keyword Retrieval)
        • 核心原理
        • 实现方式
        • 代码实例(基于Elasticsearch+BM25)
      • 3. 混合检索(Hybrid Retrieval)
        • 核心原理
        • 实现实例(RRF融合)
      • 4. 知识图谱检索(Knowledge Graph Retrieval)
        • 核心原理
        • 实现方式
        • 实例(Neo4j+Cypher查询)
      • 5. 多模态检索(Multimodal Retrieval)
        • 核心原理
        • 实现实例(CLIP检索图文)
    • 二、RAG中文档切片(Chunking)的实现
      • 1. 核心原理
      • 2. 主流切片策略
        • 策略1:固定长度切片
        • 策略2:语义感知切片(智能版):LangChain+RecursiveCharacterTextSplitter
        • 策略3:结构化切片(专业版):LangChain+PDFLoader
    • 三、流行的RAG方案
      • 1. 基础RAG(LangChain + 向量库 + LLM)
        • 核心原理
      • 2. RAG-Fusion(多查询融合)
        • 核心原理
      • 3. HyDE(假设性文档嵌入)
        • 核心原理
      • 4. LlamaIndex(企业级RAG)
        • 核心原理
      • 5. 结构化RAG(知识图谱+向量检索)
        • 核心原理
      • 6. Agent-RAG(智能代理RAG)
        • 核心原理
    • 总结
      • 关键点回顾

一、RAG的核心检索方式

RAG的检索环节是“从知识库中找到与用户问题最相关的信息”,核心目标是高召回率(不漏掉相关信息)+ 高精度(不返回无关信息)。主流检索方式可分为5类,以下是每类的核心原理、实现方式和实例:

1. 基于向量的检索(Vector Retrieval)

核心原理

这是RAG最核心、最主流的检索方式。核心逻辑是:

  • 将用户问题和知识库中的文档片段(Chunk)都通过嵌入模型(Embedding Model)转换成高维向量(语义向量);
  • 计算用户问题向量与文档片段向量的相似度(常用余弦相似度、欧氏距离)
  • 按相似度排序,返回Top-N最相关的片段。
    本质是“语义层面的匹配”,而非字面匹配,能解决关键词检索的“一词多义/多词一义”问题。
实现方式
  • 嵌入模型:开源(BGE-base/zh、Sentence-BERT、m3e-base)、闭源(OpenAI text-embedding-ada-002);
  • 向量数据库:专门存储/检索向量的数据库(Milvus、Pinecone、Chroma、FAISS);
  • 核心步骤:文
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 14:01:39

【AI】Cursor 编辑器使用指南

Cursor 编辑器使用指南 📖 目录 简介核心功能AI 交互模式模型选择快捷工具栏Web 搜索功能引用功能详解快捷键大全Agent 高级功能使用建议总结参考资源 简介 Cursor 是一款由 AI 驱动的代码编辑器,能够理解你的代码库,并通过自然语言助你更…

作者头像 李华
网站建设 2026/4/23 13:58:37

数通设备堆叠技术:iStack与CSS方案对比及应用选型

在数通网络架构中,堆叠技术是提升设备扩展性、可靠性与管理效率的核心方案,其中iStack(华为设备堆叠协议)与CSS(集群交换系统,华为高端设备堆叠方案)是业界主流的两种堆叠实现方式。结合业务口堆叠、堆叠卡堆叠、免配置堆叠等不同部署形态,二者在技术原理、性能特性、适…

作者头像 李华
网站建设 2026/4/23 12:10:24

Java死锁原因剖析:面试必看的高薪技巧!

文章目录Java死锁原因剖析:面试必看的高薪技巧!一、死锁:线程界的“抢椅子游戏”死锁的四个必要条件二、常见死锁场景:代码中的“定时炸弹”场景一:不恰当的锁顺序场景二:数据库中的锁竞争场景三&#xff1…

作者头像 李华
网站建设 2026/4/23 12:24:11

Java面试必看!如何优雅唤醒阻塞线程?

文章目录Java面试必看!如何优雅唤醒阻塞线程?一、引言二、常见问题1. 为什么不能使用Thread.stop()方法?2. 阻塞线程的常见场景三、如何优雅唤醒阻塞线程?1. 使用Interrupt机制(1)基本使用(2&am…

作者头像 李华
网站建设 2026/4/23 11:25:14

uniapp富文本rich-text

1. uniapp富文本rich-text 官方文档:https://uniapp.dcloud.net.cn/component/rich-text.html 1.1. 示例 1.1.1. richText.vue <template><view ><view class"rich-layout" ><rich-text :nodes"richText"></rich-text>&l…

作者头像 李华