news 2026/4/23 11:15:41

发明 AI 智能体长期记忆:从「金鱼记忆」到「时序推理」—— AI智能体记忆的结构化进化

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
发明 AI 智能体长期记忆:从「金鱼记忆」到「时序推理」—— AI智能体记忆的结构化进化

发明 AI 智能体长期记忆:从「金鱼记忆」到「时序推理」—— AI智能体记忆的结构化进化

    • 起点:原始尝试
    • 迭代优化过程
      • 问题一:信息检索不精准
      • 问题二:信息会过时
      • 问题三:检索结果太多、太杂
    • 系统化完善
      • 实体抽取与消歧
      • 时间表达式解析
    • 核心演化路径总结

代码:https://github.com/getzep/graphiti

起点:原始尝试

如果把用户的对话记录塞进大模型的上下文窗口,让它「记住」之前说过的话——

模型确实能回答「上周我跟你说了什么」这类问题

效果虽有,问题却很大:上下文窗口塞满11.5万token后,模型答题准确率仅 55.4%,响应延迟高达 31秒

更糟的是,对话一长,关键信息淹没在海量文本中;信息一更新,旧事实和新事实混为一谈

迭代优化过程

问题一:信息检索不精准

可问题又来了 —— 传统RAG只能做静态文档检索,语义相似≠逻辑相关

于是,你引入 三层知识图谱结构:

• Episode子图:存储原始对话消息,保留完整上下文
• Semantic Entity子图:从对话中抽取实体和关系(如「张三」-「就职于」-「公司A」)
• Community子图:用标签传播算法聚类相关实体,生成高层摘要

这样,检索时不再是「大海捞针」,而是沿着知识图谱的边精准定位

问题二:信息会过时

可问题又来了——用户说「我换工作了」,旧的就职信息怎么处理?

于是,你引入 双时序模型(Bi-temporal Model):

• T时间线:记录事实在现实中的有效期(valid_at 到 invalid_at)
• T’时间线:记录数据何时入库、何时失效

新边入库时,系统自动对比语义相关的旧边,发现矛盾就将旧边标记为「失效」,同时保留历史记录
用户问「我 现在 在哪工作」和「我 去年 在哪工作」,系统能给出不同答案

问题三:检索结果太多、太杂

可问题又来了——三种搜索方法(余弦相似度、BM25全文检索、广度优先图遍历)各有所长,结果如何整合?

于是,你引入 多级重排机制:

• RRF融合排序:综合多路召回结果
• MMR去重:最大边际相关性,去掉冗余结果
• 提及频率排序:对话中高频出现的实体优先返回
• Cross-encoder精排:用模型对候选结果精细打分

最终,上下文从11.5万token压缩到 1600 token,信息密度提升70倍

系统化完善

实体抽取与消歧

消息入库时,系统先做命名实体识别,再用反思技术(Reflexion)减少幻觉;对抽取出的实体,通过embedding相似度+全文检索找到候选重复项,让LLM判断是否合并,避免「张三」和「老张」变成两个节点

时间表达式解析

「下周四」「两周前」这类相对时间,系统根据消息发送时间戳自动转换为绝对时间,确保时序推理准确
社区动态更新

新实体入库时,用标签传播的单步逻辑快速分配社区,延迟完整社区刷新,兼顾实时性和一致性
成就总结

恭喜你,发明了 Zep——基于时序知识图谱的智能体记忆层


在时序推理任务上提升 38.4%,跨会话任务提升 30.7%——这不仅是检索系统的升级,更是赋予AI智能体真正的「长期记忆」能力

核心演化路径总结

标题:从「金鱼记忆」到「时序推理」——AI智能体记忆的结构化进化

  1. 核心问题:全文上下文检索导致信息淹没、时序混乱、延迟高
  2. 核心解法:三层时序知识图谱(Episode→Semantic→Community)+ 双时序边失效机制
  3. 技术支撑:BGE-m3嵌入、Neo4j图数据库、Cross-encoder重排、标签传播社区检测
  4. 最终成果:准确率 +18.5%,延迟 -90%,Token -98.6%
  5. 本质升华:将RAG从「静态文档仓库」变成「动态演化的世界模型」,模拟人类情景记忆与语义记忆的双系统
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 12:36:43

多传感器SLAM的时间对齐艺术:Cartographer的微秒级同步实战

在构建自主导航系统时,你是否曾遭遇这样的困境:激光雷达数据与IMU测量结果在时间上存在细微偏差,导致构建的地图出现难以解释的扭曲?这正是多传感器时间同步要解决的核心挑战。Cartographer作为谷歌开源的高性能SLAM系统&#xff…

作者头像 李华
网站建设 2026/4/23 12:38:13

AI之Course之MCP/Agent:智能体工具与模型上下文协议(MCP)互操作性 —— 深入解析工具生态,理解AI智能体如何借助外部功能与API实现“行动”,并探索通过MCP轻松发现与使用工具的方

AI之Course之MCP/Agent:智能体工具与模型上下文协议(MCP)互操作性 —— 深入解析工具生态,理解AI智能体如何借助外部功能与API实现“行动”,并探索通过MCP轻松发现与使用工具的方法—— 从集成爆炸到治理可控&#xff…

作者头像 李华
网站建设 2026/4/23 12:54:35

数据做完却不会解读?深度解析R语言富集结果中的隐藏信号

第一章:数据做完却不会解读?深度解析R语言富集结果中的隐藏信号在完成基因富集分析后,许多研究者面对成百上千的输出条目感到无从下手。R语言虽能高效生成GO或KEGG富集结果,但真正的生物学洞见往往隐藏在p值与基因列表的背后。理解…

作者头像 李华
网站建设 2026/4/23 13:03:29

农业大数据分析瓶颈突破,R语言回归诊断让模型更可靠

第一章:农业产量的 R 语言回归诊断在农业数据分析中,建立线性回归模型预测作物产量是常见任务。然而,模型的有效性依赖于若干统计假设的满足,如线性、正态性、同方差性和独立性。R 语言提供了强大的工具集进行回归诊断&#xff0c…

作者头像 李华
网站建设 2026/4/23 12:16:11

深入解析baseimage-docker:打造企业级容器化应用的最佳底座

深入解析baseimage-docker:打造企业级容器化应用的最佳底座 【免费下载链接】baseimage-docker A minimal Ubuntu base image modified for Docker-friendliness 项目地址: https://gitcode.com/gh_mirrors/ba/baseimage-docker 在云原生技术快速发展的今天&…

作者头像 李华
网站建设 2026/4/23 12:14:23

2026年口碑好的房产中介系统有哪些?

在房产中介行业数字化转型加速的2026年,一款优质的房产中介系统成为提升运营效率、规范业务流程的核心支撑。无论是单人经纪、夫妻小店,还是中大型连锁中介,都需要适配自身规模的管理工具。本次评测聚焦市场口碑较好的房产中介系统&#xff0…

作者头像 李华