news 2026/4/23 12:48:45

腾讯又开源了一个顶级 AI 项目!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
腾讯又开源了一个顶级 AI 项目!
往期热门文章: 1、Maven 4 要来了:15 年后,Java 构建工具迎来“彻底重构” 2、Spring Boot 插件化开发模式,真香! 3、雪花算法ID重复了?惨痛教训:请勿轻易造轮子! 4、唉!Stack Overflow彻底凉了,比18年前上线首月问题数量还少 5、为什么程序员不自己开发微X小程序这类似的东西赚钱? 你有没有这样的困扰?为了找一个躺在某个PDF角落里的产品参数,或者为了对比几份技术手册里的差异,花了好几天时间;又或者,你是否经历过,面对一份上百页的合同或科研论文,明明知道答案就在里面,却感觉像是在大海捞针? 今天给大家推荐一款腾讯开源的基于大模型的文档理解检索框架——WeKnora,可以给这些结构复杂、格式各异的文档“装上大脑”,让你能从“手动翻找”彻底变为“开口就问”,目前该项目在GitHub上已经收获超11k star,反响非常不错! 简介WeKnora(是一款基于大语言模型(LLM)的文档理解与语义搜索框架,专为结构复杂、内容丰富的文档场景而打造。 框架采用模型架构,融合多模态分割、语义认知索引、智能感知与大模型生成推理,构建高效、可控的文档问答流程。基于RAG(Retrieval-Augmented Generation)的核心搜索流程,将上下文相关片段与语言模型结合,实现更高质量的语义回答。 核心特征
  • Agent模式:支持ReACT Agent模式,可调用内置工具检索知识库、MCP工具和网络搜索,通过多次迭代和反思给出全面总结报告

  • 精准理解:支持 PDF、Word、图片等文档的结构化内容提取,统一构建语义视图

  • 智能推理:借助大语言模型理解文档上下文与用户意图,支持精准问答与多轮对话

  • 多类型知识库:支持FAQ和文档两种类型知识库,支持文件夹导入、URL导入、标签管理和在线录入

  • 灵活扩展:从解析、嵌入、召回到生成全流程解耦,便于灵活集成与定制扩展

  • 效检索:混合多种检索策略:关键词、向量、知识图谱,支持跨知识库检索

  • 网络搜索:支持可扩展的网络搜索引擎,内置DuckDuckGo搜索引擎

  • MCP工具集成:支持通过MCP扩展Agent能力,内置uvx、npx启动工具,支持多种传输方式

  • 对话策略:支持配置Agent模型、普通模式模型、检索阈值和Prompt,精确控制多轮对话行为

  • 简单易用:直观的Web界面与标准API,零技术门槛快速上手

  • 安全可控:支持本地化与私有云部署,数据完全自主可控

技术架构

WeKnora 采用现代化的模块化架构,将文档理解与检索流水线清晰解耦。这主要包括:

  • 文档处理层:负责多格式文档(PDF, Word, 图片等)的解析与预处理。

  • 知识建模层:通过向量化、分块、知识图谱等技术,为内容构建深度的知识表示。

  • 检索引擎层:创新性地融合了关键词、向量、知识图谱等多种检索策略,确保召回既高效又精准。

  • 推理生成层:利用大语言模型进行深度理解和答案生成,并在此之上集成了Agent推理能力。

  • 交互展示层:提供直观的Web界面和标准API。

这种设计带来了极大的灵活性。你可以自由组合检索策略、大模型(支持 Ollama,可灵活切换 Qwen、DeepSeek 等主流模型)和向量数据库。同时,全链路的设计也保障了可控性,支持私有化部署,数据完全自主。

从 v0.1.3 开始,系统还增加了登录认证功能,官方强烈建议将服务部署在内网环境,并配置好防火墙,以保障安全。

快速开始

环境要求

确保本地已安装以下工具:

  • Docker

  • Docker Compose

  • Git

安装步骤

① 克隆代码仓库

# 克隆主仓库 git clone https://github.com/Tencent/WeKnora.git cd WeKnora

② 配置环境变量

# 复制示例配置文件 cp .env.example .env # 编辑 .env,填入对应配置信息 # 所有变量说明详见 .env.example 注释

③ 启动服务 (含 Ollama)

检查.env文件中需要启动的镜像。

./scripts/start_all.sh

或者

make start-all

④ 停止服务

./scripts/start_all.sh --stop # 或 make stop-all

服务访问地址

启动成功后,可访问以下地址:

  • Web UI:http://localhost

  • 后端 API:http://localhost:8080

  • 链路追踪(Jaeger):http://localhost:16686

功能展示

Web UI 界面

知识库管理

对话设置

Agent模式工具调用过程

开源地址

https://github.com/Tencent/WeKnora

来源:极客之家

往期热门文章:

1、Druid 崩了,线上直接炸锅! 2、Spring6.0+Boot3.0:秒级启动、万级并发的开发新姿势 3、新项目为什么更推荐WebFlux,而非SpringMVC? 4、那些回老家的程序员,现在过得怎么样? 5、为什么程序员,越来越排斥面试时做题? 6、满屏Service注入混乱?用Lambda封装个统一调用组件,直接起飞! 7、年少不知自增好,错把UUID当个宝!!! 8、长期当程序员会失去什么? 9、支付宝:多线程事务怎么回滚?说用@Transactional可以回去等通知了! 10、效率拉爆:IntelliJ IDEA 中的这几款 AI 编程插件你都用过吗?

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 8:17:06

证件照背景替换联动:GPEN+语义分割联合部署案例

证件照背景替换联动:GPEN语义分割联合部署案例 你是否遇到过这样的问题:手头有一张清晰的人像照片,但背景杂乱,不适合做证件照?或者想快速换上白底、蓝底等标准背景,却苦于操作复杂、边缘处理不自然&#…

作者头像 李华
网站建设 2026/4/23 9:46:13

让计算机听懂你的话:UI-TARS智能助手实战指南

让计算机听懂你的话:UI-TARS智能助手实战指南 【免费下载链接】UI-TARS-desktop A GUI Agent application based on UI-TARS(Vision-Lanuage Model) that allows you to control your computer using natural language. 项目地址: https://gitcode.com/GitHub_Tre…

作者头像 李华
网站建设 2026/4/15 14:08:34

Qwen3-4B与Yi-1.5对比评测:编程任务表现全面分析

Qwen3-4B与Yi-1.5对比评测:编程任务表现全面分析 1. 背景与测试目标 当前大语言模型在编程辅助领域的应用日益广泛,开发者越来越依赖模型生成高质量代码、理解复杂逻辑、调试错误以及完成实际工程任务。本文聚焦于两款具有代表性的开源中等规模语言模型…

作者头像 李华
网站建设 2026/4/23 9:54:40

Citra模拟器跨平台联机完整攻略:打造完美3DS多人游戏体验

Citra模拟器跨平台联机完整攻略:打造完美3DS多人游戏体验 【免费下载链接】citra 项目地址: https://gitcode.com/GitHub_Trending/ci/citra 还在为无法和朋友一起玩3DS游戏而烦恼吗?Citra模拟器为你打开了通往3DS多人游戏世界的大门。这款强大的…

作者头像 李华
网站建设 2026/4/23 9:52:53

Windows文件系统开发终极指南:从零构建自定义存储解决方案

Windows文件系统开发终极指南:从零构建自定义存储解决方案 【免费下载链接】winfsp Windows File System Proxy - FUSE for Windows 项目地址: https://gitcode.com/gh_mirrors/wi/winfsp 你是否曾经想要将云端数据、数据库内容或内存信息以文件系统的形式呈…

作者头像 李华