news 2026/4/23 14:09:55

大模型应用开发(十六)_RAG概述

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型应用开发(十六)_RAG概述

4. RAG概述


提高大语言模型(LLM)回答的准确性和一致性通常有三种方式:

  • prompt优化:prompt优化可以在文本生成和行为控制上提供初步帮助。
  • RAG(检索增强生成):RAG侧重补充训练数据中没有的或过时的信息
  • fine-tuning(微调):fine-tuning则主要调整模型的行为模式,如语气、回答一致性和语言风格。

OpenAl 这个图就把优化上下文信息内容LLM 行为优化分两个轴,一个针对 what the model needs to know ,一个针对 how the model needs to act

黑色方块箭头指的是常见优化LLM accuracy保持consistent behavior的常规步骤:

1、初始提示 (Prompt):首先从一个基础提示(Prompt)开始。提示是你提供给模型的问题或输入,模型会根据这个提示生成结果

2、添加静态的 Few-Shot示例:Few-shot学习是指在提示中添加几个示例,这些示例展示了你期望的输入-输出关系。通过静态地添加这些示例,你可以提高模型生成结果的一致性。同时可以evals评估测试

3、加入动态检索步骤:通过检索机制,模型可以动态地根据问题获取与之相关的 Few-shot 示例。这有助于提高模型的性能,因为它可以在每次生成时获取到更相关的上下文。

4、准备数据集并进行微调:为了提高模型的一致性,你需要准备一个包含 50 个以上示例的数据集,并在这个数据集上对模型进行微调

5、优化检索和加入事实检查步骤::索机制帮助模型找到更相关的上下文,而事实检査步骤可以帮助检测模型生成的错误(也称为“幻觉”),以确保模型生成的内容更加准确。

6、再次训练模型:在加入了新的检索机制和事实检査步骤后,你可以用增强的输入数据重新训练模型,以进一步提高性能


RAG技术本质

4.1 RAG 是什么

RAG(Retrieval-Augmented Generation)是一种结合了信息检索(Retrieval)生成式模型(Generation)的 AI 技术框架。

它的核心思想是:

在生成回答之前,先从外部知识库中检索到相关信息,再将这些信息与用户问题一同输入大语言模型,让模型“带着事实”回答问题。

这样,模型的回答不仅更加准确可解释实时更新,还能避免模型“幻觉”(hallucination)。


4.2 RAG 的基本流程

RAG 通常分为两个阶段

1️⃣ 检索阶段(Retrieval)

  • 用户输入一个查询(query)。
  • 系统通过向量检索(如 FAISS、Milvus、Elasticsearch)在知识库中寻找最相关的文档片段。
  • 输出若干条与问题相关的文本内容(通常称为contextevidence)。

2️⃣ 生成阶段(Generation)

  • 将检索到的上下文与用户问题一起输入到大语言模型(如 GPT、Llama、Claude)。
  • 模型在这些上下文的辅助下生成答案。

4.3 RAG 架构示意

用户问题 ↓ [检索模块] → 检索外部知识库(向量数据库) ↓ 返回相关文档 [生成模块] ← 将问题 + 检索结果输入大模型 ↓ 生成增强回答

4.4 RAG 的关键组件

组件作用常见实现
文档预处理将知识源(PDF、网页、数据库)拆分成段落块(chunks)LangChain、LlamaIndex
向量化(Embedding)把文本转成向量用于相似度检索OpenAI Embeddings、Sentence-BERT、bge-large-zh
向量数据库存储并检索文本向量FAISS、Milvus、Pinecone、Chroma
检索策略根据相似度、BM25、RRF 等算法选出上下文similarity search、hybrid search
生成模型根据检索结果生成回答GPT-4、Llama3、Claude、Qwen
Prompt 模板控制生成阶段的上下文格式“Context + Question + Instruction” 模板
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/22 13:12:54

Linux系统编程——进程进阶:exec 族、system 与工作路径操作

一、exec族函数核心功能:执行本地任意可执行文件,是进程代码替换的核心工具。典型搭配:常和 fork() 配合。让子进程执行 exec,避免父进程自身代码被替换。内存逻辑:执行 exec 后,原进程的代码段会被新程序完…

作者头像 李华
网站建设 2026/4/23 13:18:18

西门子 S7 - 1200 智能仓库组态仿真全解析

西门子S7-1200智能仓库组态仿真,博途自动化仓库,S7-1200自动化仓库控制系统,组态仿真 包括:西门子S7-1200PLCwincc组态仿真,IO表,接线图,报告等在自动化控制领域,西门子 S7 - 1200 系…

作者头像 李华
网站建设 2026/4/22 17:09:27

上传文件出现“ 413 Request Entity Too Large“错误

今天上传文件的时候提示“ 413 Request Entity Too Large",HTTP 413错误表示请求体大于服务器允许的最大大小。这个限制可以由服务器配置(如Nginx、Apache等)或应用自身(如Java、Node.js等)来控制。在Nginx中&am…

作者头像 李华
网站建设 2026/4/16 13:51:00

CSS样式初识:给网页穿上漂亮的“外衣”

文章目录前言一、CSS是什么?二、CSS的核心作用三、CSS的3种引入方式内联样式(行内样式)内部样式表外部样式表总结前言 HTML就像搭建好的房屋框架,而CSS就是给房屋装修、刷漆、布置格局的“魔法师”。今天这篇文章,就带…

作者头像 李华
网站建设 2026/4/22 22:13:16

Java毕设选题推荐:基于springboot高校奖助学金系统设计与实现基于springboot高校学生奖学金评定系统的设计与实现【附源码、mysql、文档、调试+代码讲解+全bao等】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/4/23 11:31:32

NO17数据结构选择题考点|图

图 5. 路径、路径长度和回路顶点 vp到顶点 vq之间的一条路径是指顶点序列 vp,vi1,vi2,⋯ ,vim,vq,当然关联的边也可理解为路径的构成要素。路径上的边的数目称为路径长度。第一个顶点和最后一个顶点相同的路径称为回路或环。若一个图有n 个顶点,且有大于…

作者头像 李华