news 2026/5/9 8:24:12

42.人工智能实战:RAG Chunk 切分怎么做才不翻车?从固定长度切分到语义切分、评测与回归优化

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
42.人工智能实战:RAG Chunk 切分怎么做才不翻车?从固定长度切分到语义切分、评测与回归优化

人工智能实战:RAG Chunk 切分怎么做才不翻车?从固定长度切分到语义切分、评测与回归优化


一、问题场景:文档都入库了,但 AI 总是答不到重点

很多 RAG 系统刚开始做文档切分时,都会用一个简单策略:

每 500 字切一段

或者:

每 1000 tokens 切一段

这个方法容易实现,但上线后经常出现问题:

1. 一个完整规则被切成两半 2. 标题和正文分离 3. 表格被截断 4. 代码块被切断 5. 检索命中了半句话 6. 模型拿到上下文后仍然无法回答

我见过一个真实例子。

原文是:

销售客户拜访报销规则: 销售人员拜访客户时,一线城市住宿费不超过650元,二线城市不超过450元。 该规则仅适用于已登记客户拜访场景。

固定长度切分后变成:

chunk_1: 销售客户拜访报销规则: 销售人员拜访客户时,一线城市住宿费不超过650元,二线城市 chunk_2: 不超过450元。 该规则仅适用于已登记客户拜访场景。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 8:22:24

linux之网络子系统(13)- 内核发送数据包流程以及相关实际问题

一、相关实际问题 查看内核发送数据消耗的CPU时应该看sy还是si 在服务器上查看/proc/softirqs,为什么NET_RX要比NET_TX大得多 发送网络数据的时候都涉及那些内存拷贝操作 零拷贝到底是怎么回事 为什么Kafka的网络性能很突出 二、网络包发送过程总览 调用系统调用send发送 内存…

作者头像 李华
网站建设 2026/5/9 8:22:00

PIC18单片机与24XXX EEPROM的I2C通信实战

1. PIC18单片机与24XXX系列EEPROM的I2C通信实战指南在嵌入式系统开发中,非易失性存储是保存配置参数、运行日志等关键数据的必备功能。Microchip的24XXX系列EEPROM凭借其稳定的性能和简单的接口,成为工程师们的首选。本文将基于PIC18F452单片机&#xff…

作者头像 李华
网站建设 2026/5/9 8:20:34

Stratix III FPGA的DPA电路与rx_dpa_locked信号解析

1. Stratix III DPA电路架构解析动态相位调整(DPA)电路是Stratix III FPGA实现高速LVDS接口的核心模块。其核心工作原理是通过接收端PLL提供的8个相位间隔45的时钟信号,动态选择最佳采样相位点。与常规CDR电路不同,Stratix III的DPA设计具有以下特性&…

作者头像 李华
网站建设 2026/5/9 8:20:32

Yeti实体关系图构建指南:如何可视化威胁活动与攻击者关联

Yeti实体关系图构建指南:如何可视化威胁活动与攻击者关联 【免费下载链接】yeti Your Everyday Threat Intelligence 项目地址: https://gitcode.com/gh_mirrors/ye/yeti 🔍 Yeti威胁情报平台为网络安全分析师提供了一个强大的实体关系图构建工具…

作者头像 李华
网站建设 2026/5/9 8:15:31

打卡信奥刷题(3232)用C++实现信奥题 P8436 【模板】边双连通分量

P8436 【模板】边双连通分量 题目描述 对于一个 nnn 个节点 mmm 条无向边的图,请输出其边双连通分量的个数,并且输出每个边双连通分量。 输入格式 第一行,两个整数 nnn 和 mmm。 接下来 mmm 行,每行两个整数 u,vu, vu,v&#xff0…

作者头像 李华