news 2026/6/18 0:04:10

让 AI 替你翻书:LLM Wiki 知识管理实战总结

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
让 AI 替你翻书:LLM Wiki 知识管理实战总结

让 AI 替你翻书:LLM Wiki 知识管理实战指南

作者:科技界的一粒微尘
一位工程师用 Obsidian + AI Agent 搭建嵌入式 Linux 知识库的完整实践

📋本文概览:当知识从文档堆变成一张关联网络,搜索就不再是唯一的入口。本文以鸿鸥派 Hi3519DV500 开发板项目为实例,完整展示 LLM Wiki 的搭建思路、三层架构、三种使用方式,以及与 RAG 互补配合的最佳实践。全文包含 3 张架构图解和 5 张实操截图。


老规矩先看预览

一、痛点:工程师的知识困境

每一个硬件工程师或嵌入式开发者,都面对过同一个问题:项目资料越来越多,但真正想用的时候找不到。

以鸿鸥派 Hi3519DV500 开发板项目为例,一个典型的嵌入式项目会积累这些资料:

原厂资料:SDK 开发指南、硬件设计手册、数据手册(PDF 版本,随便一份就几百页)

自建文档:编译环境搭建记录、操作命令手册、问题排查日志

学习笔记:芯片架构分析、外设接口梳理、AI 推理参数速查

工具与脚本:烧录工具、驱动包、测试脚本

这些资料分散在几十个目录中,格式有 PDF、Word、Markdown、Excel,甚至还有图片和压缩包。你需要查一个 RTSP 推流地址时,可能要打开七八个文件才能找到。

传统的解决方案有两种:

一种是「堆文件夹」—— 把所有资料按目录存好,你需要什么自己去翻。结果往往是翻了一下午,找到了三年前的版本,发现参数已经改了。

另一种是「用 RAG」—— 把所有文档扔给大模型,每次问问题都重新搜索一遍。听起来很美好,但每次问同样的问题都要消耗 Token,而且模型不理解「这个参数从哪来的」。

那么,有没有第三种方案?

有,就是LLM Wiki


二、什么是 LLM Wiki

LLM Wiki(Large Language Model Wiki)是 Andrej Karpathy 提出的一种知识管理理念。核心思想很简单:

把知识写下来,而不是存起来。

传统的知识库是「仓储式」的——把一堆文档丢进去,需要时再翻出来。LLM Wiki 是「蒸馏式」的——让 AI Agent 把原始资料提炼成互相关联的知识页面,形成一张知识网络。

💡核心区别:传统知识库存的是「文件」,LLM Wiki 存的是「知识」。

一张图说明它的三层架构:

图中可见三个层次:底层 raw/ 存放原始文章和数据手册(不可修改),中间层 entities + concepts 是 AI 蒸馏后的知识页面,顶层 SCHEMA.md + index.md + log.md 控制规则。箭头方向代表数据流向——来源不可变,知识不断生长。

第一层 —— 原始来源(raw/):所有原始资料,包括文章、论文、会议纪要、图片。这一层的原则是「不可变」——一旦摄入就不再修改,只做追加。如果将来来源文件有更新,通过 SHA256 哈希值比对来判断是否需要重新摄入。

第二层 —— 蒸馏知识:这是 Wiki 的核心。AI Agent 把第一层的原材料提炼成结构化的知识页面,分为三种类型:

  • 实体页(entities/):描述真实存在的事物,比如Hi3519DV500 芯片鸿鸥派 HongOU PIOS04A10 图像传感器
  • 概念页(concepts/):描述抽象的知识主题,比如NPU AI 推理MPP 媒体处理流水线RTSP 视频推流
  • 对比页(comparisons/)和查询归档(queries/):记录有价值的对比分析和查询结果

每个页面都通过[[wikilinks]]双向链接在一起。打开任意一页都可以顺着链接跳到相关页面,就像 Wikipedia 一样。

第三层 —— 规则定义(Schema):控制整个 Wiki 的「宪法」。SCHEMA.md定义领域范围、命名规范、标签体系、页面创建阈值。index.md是内容目录。log.md记录所有操作历史。


三、以鸿鸥派项目为例:Wiki 长什么样

我把鸿鸥派 Hi3519DV500 项目中的全部知识蒸馏成了一个嵌入式 Linux LLM Wiki,包含14 个页面

3 个实体页:Hi3519DV500 芯片、鸿鸥派 HongOU PI、OS04A10 图像传感器

11 个概念页:交叉编译工具链、BSP 编译系统、NPU AI 推理、AI ISP 智能图像处理、MPP 媒体处理流水线、RTSP 视频推流、启动配置、电源管理、DDR4 接口设计、传感器时钟配置、外设接口总览

这些页面覆盖了从硬件设计到软件开发的完整知识链。为了方便理解,可以想象一个三层同心圆:

外圈 —— 芯片级知识:Hi3519DV500 芯片是什么架构、OS04A10 摄像头怎么接、鸿鸥派开发板的硬件资源有哪些。这些是「物」的知识,定义了你手上有哪些东西。

中圈 —— 系统级知识:交叉编译工具链怎么配、BSP 怎么编译、启动配置要烧写哪些分区。这些是「怎么搭环境」的知识,决定了你能不能把代码跑起来。

内圈 —— 应用级知识:NPU 怎么跑 YOLOv8 模型、RTSP 怎么推流、AI ISP 怎么调参。这些是「怎么用」的知识,直接驱动业务功能。

Wiki 的美妙之处在于:这三圈知识通过[[wikilinks]]互相链接,从外到内或从内到外都可以顺着连接探索。比如你从「NPU AI 推理」出发,可以往回找到「Hi3519DV500 芯片」了解算力规格,往前找到「RTSP 视频推流」了解怎么看结果,横向找到「AI ISP 智能图像处理」了解它和 NPU 推理的关系。

左侧文件树清晰展示了 Wiki 的完整结构:entities/下有 3 个实体(芯片、开发板、传感器),concepts/下有 11 个概念页面(NPU 推理、RTSP 推流、电源管理等),raw/目录存放原始来源。右侧是电源管理.md页面,包含 YAML 头部、标签体系和结构化表格。

Obsidian 中打开这个目录,左侧文件树一目了然。entities/目录下是芯片、开发板、传感器三个实体;concepts/目录下是 11 个概念页面。每一页都有完整的 YAML 头部信息(创建日期、更新日期、类型、标签、来源引用)和严谨的页面结构。

最惊艳的是 Graph View——所有[[wikilinks]]连接在一起,形成一张知识网络。你可以看到「Hi3519DV500 芯片」链接到「NPU AI 推理」,后者又链接到「RTSP 视频推流」和「MPP 媒体处理流水线」。「启动配置」链接到「传感器时钟配置」和「电源管理」。每一页至少链接 2 个其他页面,没有孤立的知识点。

(限于本文格式,Graph View 的动态交互效果无法在静态截图中完整展示,建议在 Obsidian 中亲自打开体验)

终端中直接cat index.md即可看到全部 14 个页面的完整目录。Entities 分类下列出了芯片、开发板、传感器三个实体;Concepts 分类下列出了 11 个概念页面,每个条目都有一句话摘要。

如果你不喜欢图形界面,终端里也能看:

# 查看总目录cat"/home/ros2/obsidian/embedded-linux-wiki/index.md"# 查看具体页面cat"/home/ros2/obsidian/embedded-linux-wiki/concepts/NPU AI 推理.md"# 查看最近操作记录cat"/home/ros2/obsidian/embedded-linux-wiki/log.md"

Wiki 本质上就是一个目录下的 markdown 文件,没有任何特殊的数据格式依赖。VSCode、vi、Notepad++,任何一个文本编辑器都能打开和修改。


四、三种使用方式

图中展示了 LLM Wiki 的三种使用方式:左边「自己翻阅」适合系统学习,中间「问我查」适合日常快速获取信息,右边「扩展 Wiki」适合知识补充。底部是鸿鸥派项目中查询 YOLOv8 参数的完整流程示例。

方式一:自己翻阅

这是最传统的方式——打开 Obsidian 或文本编辑器,像看书一样浏览。适合你想系统学习某个知识领域的时候。

比如你想了解 NPU 推理的完整流程,可以打开index.md找到NPU AI 推理,点击进入页面。看完后顺着底部的[[wikilinks]]点击RTSP 视频推流了解怎么看推理结果,再点击MPP 媒体处理流水线了解视频数据是怎么从摄像头流向 NPU 的。

这种链式阅读让你不知不觉间建立起完整的知识框架。

方式二:问我查

这是最方便的方式——直接通过对话问 AI,AI 去 Wiki 里找答案。

比如我(AI Agent)正在通过飞书与工程师沟通。工程师问:「NPU 跑 YOLOv8 的参数是多少?」

我只需要三步:

第一步:打开index.md,找到涉及 NPU 和 AI 推理的相关页面

第二步:打开NPU AI 推理页面,找到如下内容:

YOLOv8:参数 8 8 0 3,RTSP 地址 /live264HRNet:参数 a 0 3,RTSP 地址 /live264MOTR:参数 b 0 0 3,RTSP 地址 /live264

第三步:回复工程师:「YOLOv8 的调用参数是 8 8 0 3,推理结果通过 RTSP 在 live264 查看,拉流命令是 ffplay -vf “vflip,hflip” rtsp://192.168.1.168/live264」

整个过程不超过 30 秒,工程师不需要自己打开任何一个文件。这就是 LLM Wiki 的核心优势——Agent 替你翻书,你只管问。

方式三:扩展 Wiki

当发现 Wiki 缺少某块知识时,告诉 AI 来补充。

比如工程师说:「把 OpenCV 在海思平台上的交叉编译移植步骤加到 Wiki 里。」

AI 会这样做:

第一步:从提供的资料中提取关键信息(OpenCV 版本、cmake 参数、依赖库、IVE 硬件加速适配)

第二步:创建一个新的概念页OpenCV 交叉编译与移植.md,包含完整的 YAML 头部和页面结构

第三步:建立[[wikilinks]]链接到现有页面——链接到交叉编译工具链(因为要用到 aarch64-linux-gnu-gcc)、链接到BSP 编译系统(因为放在 BSP 编译流程中)、链接到NPU AI 推理(因为 OpenCV 处理后的数据可能送入 NPU)

第四步:更新index.md,在 concepts 分类下加上新页面链接

第五步:log.md中追加操作记录

这样,下次任何人问「怎么在鸿鸥派上部署 OpenCV」,Wiki 里已经有答案了。而且是结构化的、与其它知识关联的。


五、LLM Wiki vs RAG

有人会问:既然已经有了 RAG(Retrieval-Augmented Generation,检索增强生成),为什么还需要 LLM Wiki?

回答这个问题最好的方式是对比两张「考试卷」。

左右对比 LLM Wiki 和传统 RAG 的原理、适合场景、优缺点。底部给出最佳实践:两者互补不是互斥——RAG 做快速检索,LLM Wiki 做深度理解。

RAG 的模式是「开卷考试」:每次遇到问题,大模型都在海量文档中现场翻找答案。好处是灵活——加一份新文档,重建索引就行。坏处是每次考试都翻书,同样的知识点每次都要重新算一次 Token。

LLM Wiki 的模式是「做笔记」:平时把知识点整理成结构化的笔记,考试时直接翻笔记。好处是高效——知识点提炼过一次就能反复用,而且笔记之间有关联关系,能看到知识的全貌。坏处是需要有人花时间做笔记。

在实际项目中,两者是互补的,不是互斥的:

什么时候用 RAG:查精确的参数值、命令、数字。比如「OS04A10 的 MIPI 数据通道数是多少?」——这种问题在原始数据手册里就有精确答案,RAG 检索出来直接给就行。

什么时候用 LLM Wiki:理解概念之间的关系、构建知识体系、长期积累。比如「NPU 推理和 AI ISP 有什么区别,数据流是怎么走的?」——这种问题需要把多个概念串联起来,Wiki 的链接结构天然适合。

💡鸿鸥派项目的最佳实践:两套同时用。日常问题先用 LLM Wiki 回答(速度快、无 Token 消耗),如果 Wiki 里没有精确数据,再 fallback 到 RAG 检索原始文档。这样做的好处是:

  • 70% 的常见问题从 Wiki 直接回答,零 Token 开销
  • 30% 的精确参数从 RAG 检索,但 RAG 的索引覆盖了全量文档
  • 随着 Wiki 不断扩展,那 30% 会逐渐变成 20%、10%

六、如何开始使用 LLM Wiki

如果你也想建立自己的 LLM Wiki,这里是最简洁的入门路径:

第一步:确定领域和范围

Wiki 不是越大越好。一个 Wiki 最好只覆盖一个领域,比如「嵌入式 Linux」、「深度视觉算法」或「机械设计」。范围一旦确定,SCHEMA.md 里的标签体系、页面创建阈值和命名规范才有了依据。不要试图用一个 Wiki 装下所有知识——那是项目文档库的职责,不是 Wiki 的。

第二步:准备原始资料

把你手头所有相关的原始文档集中到raw/目录中。不需要整理格式,PDF 数据手册、Markdown 笔记、网页摘录、PPT 都可以。AI Agent 会处理格式转换。关键原则是:原始资料不可修改。如果发现资料有错,不要在 raw/ 里改,而是在 Wiki 页面中标注更正。这样将来重新摄入时可以比对 SHA256 哈希值来判断是否需要更新。

第三步:让 AI 摄入并蒸馏

这是最关键的一步。AI 会按以下流程自动处理:

内容筛选:读取所有原始资料,根据 SCHEMA.md 的领域规则判断哪些内容值得提取

实体识别:识别核心实体(芯片型号、开发板、传感器、工具)和核心概念(协议、架构、流程、设计模式)

页面创建:创建结构化的 Wiki 页面,每页包含 YAML 头部(创建日期、标签、来源引用)和结构化正文

链接建立:建立[[wikilinks]]交叉链接,确保每页至少链接到 2 个相关页面

索引更新:更新 index.md(内容目录)和 log.md(操作记录)

以鸿鸥派项目为例,AI 从 17 个原始文档中提取了 3 个实体页和 11 个概念页,共 14 页。整个过程花了不到 5 分钟。

第四步:日常使用和维护

使用有三种方式(翻阅、问答、扩展),前面已经详细说了。

维护的关键原则是:每次有新的知识来源,就摄入一次。好比给 Wiki 施肥,让它不断生长。比如工程师发现了一个新的编译坑,写了一份排查记录,把这个文档扔给 AI,AI 会自动判断是新建一个「踩坑记录」页面还是追加到现有页面中。

另外,定期运行 lint 检查也很重要。AI 可以自动检查:有没有孤立的页面(没有被任何其他页面链接)、有没有断裂的 wikilinks(链接到了不存在的页面)、有没有页面超过 200 行需要拆分、有没有冲突的知识(两个页面说法矛盾)、有没有超过 90 天没更新的陈旧内容。

这些检查让 Wiki 保持健康和活跃。


七、总结

LLM Wiki 不是一个产品,而是一种思维方式。它从「存文件」转向「存知识」,从「每次重新搜索」转向「一次提炼、反复使用」。

对于嵌入式开发者来说,项目周期长、资料种类多、知识折旧慢,这种知识管理方式特别适合。你不需要记住每一个参数和命令——把知识交给 Wiki,把精力留给创造。

来看看 Wiki 中一页的完整内容。打开NPU AI 推理.md

这一页包含了 YAML 头部(类型、标签、来源引用)、SVP 支持的模型表格(YOLOv8/HRNet/MOTR)、运行命令、模型调用参数、拉流查看方式等完整信息。底部通过[[wikilinks]]链接到相关页面。

每一页都是这样结构化的:前端元数据让机器可读,正文让工程师可读,底部的链接让知识可发现。这样一来,无论是直接翻阅还是通过 AI 问答,知识都以一致的格式呈现。

Wiki 的知识是「一次提炼、百次复用」的。在 RAG 模式下,每次问「NPU 算力是多少」都要重新搜索、重新生成答案,浪费 Token。而在 Wiki 模式下,这句话已经写在了Hi3519DV500 芯片.md页面里,每次回答都是直接从 Wiki 读出,不消耗任何 Token。日积月累,这种差距非常可观。

作者:科技界的一粒微尘
一位在嵌入式 Linux 和 AI 视觉领域摸爬滚打的工程师。关注「AI的探索之旅」,一起探索技术与工程的交叉点。


📌 文章中的示意图

本文共包含 6 张示意图:

编号文件名内容
图1wiki-architecture.pngLLM Wiki 三层架构图
图2usage-flow.png三种使用方式与实例流程
图3wiki-vs-rag.pngLLM Wiki 与 RAG 对比图
图4obsidian-screenshot.jpgObsidian 文件树+电源管理页面截图
图5terminal-index.jpg终端 cat index.md 截图
图6npu-page.jpg终端 cat NPU AI 推理.md 截图
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/18 0:02:43

终极指南:四步使用OpenCore Legacy Patcher免费升级老旧Mac系统

终极指南:四步使用OpenCore Legacy Patcher免费升级老旧Mac系统 【免费下载链接】OpenCore-Legacy-Patcher Experience macOS just like before 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 还在为你的老旧Mac电脑无法升级到…

作者头像 李华
网站建设 2026/6/18 0:02:00

【IC】【Low Power】从功耗构成到设计实践:CMOS低功耗技术全景解析

1. CMOS电路功耗构成解析 在芯片设计中,功耗就像汽车的油耗指标,直接影响着设备的续航能力和发热表现。想象一下你的手机如果功耗控制不好,可能用不了半天就得充电,还会烫得像暖手宝。CMOS电路的功耗主要来自两个"耗电大户&q…

作者头像 李华
网站建设 2026/6/17 23:55:08

ZigBee ZCL色彩控制集群API实战:从协议解析到智能灯光开发

1. ZigBee ZCL色彩控制集群:从协议栈到智能灯光的桥梁如果你正在开发智能照明产品,尤其是支持RGB或RGBW调色的智能灯,那么你一定绕不开ZigBee协议栈。而在ZigBee的应用层,ZigBee Cluster Library (ZCL) 是设备间实现“说同一种语言…

作者头像 李华
网站建设 2026/6/17 23:48:11

终极指南:如何在PC上免费畅玩Switch游戏的yuzu模拟器

终极指南:如何在PC上免费畅玩Switch游戏的yuzu模拟器 【免费下载链接】yuzu 任天堂 Switch 模拟器 项目地址: https://gitcode.com/GitHub_Trending/yu/yuzu 你想在电脑上体验任天堂Switch游戏吗?🚀 yuzu模拟器正是你需要的解决方案&a…

作者头像 李华
网站建设 2026/6/17 23:46:43

数字疗法Sleepio:基于CBT-I的睡眠改善方案深度解析

1. 项目概述:Sleepio是什么,以及它为何值得关注最近几年,睡眠问题几乎成了现代人的“标配”,从辗转反侧的失眠到质量不高的浅睡,困扰着越来越多的人。传统的解决方案,比如药物辅助,往往治标不治…

作者头像 李华
网站建设 2026/6/17 23:44:28

VirtualMotionCapture终极指南:如何在VR游戏中实现实时动作捕捉

VirtualMotionCapture终极指南:如何在VR游戏中实现实时动作捕捉 【免费下载链接】VirtualMotionCapture VRゲーム中にモデルをコントロール 项目地址: https://gitcode.com/gh_mirrors/vi/VirtualMotionCapture VirtualMotionCapture(简称VMC&…

作者头像 李华